Лабораторная работа - Терминологический словарь по машинной лексикографии - файл n1.doc

Лабораторная работа - Терминологический словарь по машинной лексикографии
Скачать все файлы (92 kb.)

Доступные файлы (1):
n1.doc92kb.04.02.2014 13:51скачать

n1.doc

Выполнила: Рябоненко Татьяна

РФ/сп – 11

Тематический словарь по «Машинной лексикографии»


Оглавление


Оглавление 2



Предметный указатель

Автоматические словари для программ обработки текста

Автоматические словари конечного пользователя-человека

Автоматический словарь

Авторский словарь

Вводная статья

Вокабула

Гипертекст

Глоссарий

Гнездование

Идеографический словарь

Компьютерная лексикография

Конкорданс

Лексикография

Лингвистический словарь

Нелингвистический словарь

Общий лингвистический словарь

Общий нелингвистический словарь

Онтология

Построение конкордансов

Практическая лексикография

Словарь конкордансов

Словари сочетаемости

Словари трудностей

Словари языковых форм

Словарная статья

Словарь

Словарь синонимов

Словник

Специальный лингвистический словарь

Специальный нелингвистический словарь

Сценарий

Таксон

Тезаурус

Теоретическая лексикография

Филиация

Фрейм

Электронный словарь

А

Автоматические словари для программ обработки текста – можно назвать автоматическими словарями в точном смысле. Они, как правило, не предназначены для обычного пользователя. Особенности их структуры, сфера охвата словарного материала задаются теми программами, которые с ними взаимодействуют.

Автоматические словари конечного пользователя-человека – это словари, которые по интерфейсу и структуре словарной статьи существенно отличаются от автоматических словарей, включенных в системы машинного перевода, системы автоматического реферирования, информационного поиска и т.д.

Это могут быть компьютерные версии известных обычных словарей. Например: компьютерные аналоги толковых словарей английского языка (автоматический Вебстер, автоматический толковый словарь английского языка издательства Коллинз, автоматический вариант Нового большого англо-русского словаря под ред. Ю.Д.Апресяна и Э.М.Медниковой), компьютерная версия словаря Ожегова.

Автоматический словарь – это словарь в специальном машинном формате, предназначенный для использования на ЭВМ пользователем или компьютерной программой обработки текста.

Авторский словарь – в идеальном случае фиксируются все слова, представленные в произведениях того или иного писателя (часто включая тексты вариантов, писем, заметок). Типичным примером издания такого Типа является «Словарь языка Пушкина» под редакцией В. В. Виноградова (м., 1956-1961).

В

Вводная статья – это статья, в которой объясняются принципы пользования словарем и содержится информация о структуре словарной статьи.

Вокабула (лат. vocabulum слово) – 1) слово иностранного языка с переводом на родной язык; 2) заголовок словарной статьи.

Г

Гипертекст – организационная надстройка над текстом, позволяющая рассматривать его в различных структурных представлениях. Гипертекст позволяет наряду с линейным чтением текста (слева направо, строка за строкой) двигаться и по другим структурным схемам, находить и выбирать определенные фрагменты, расположенные в различных частях текста. Гипертекстовая организация крупных массивов информации не только делает их обозримыми и облегчает оперирование с ними, но и позволяет извлекать из них такие сведения, которые специально не закладываются в них при их создании.

Глоссарий (лат. glossarium) – толковый словарь устарелых и малопонятных слов к какому-нибудь тексту, преим. Древнему.

Гнездование – объединение в одно «гнездо» (в рамках одной словарной статьи) слов, связанных общностью корня, даже если это нарушает алфавитную последовательность.

И

Идеографический (семантический) словарь – словарь, в котором статьи упорядочены не по алфавиту, как обычно, а по смыслу (лексическому значению заглавного слова или фразы). Если алфавитный словарь служит для того, чтобы узнать что-то о данном слове, то идеографический словарь служит для того, чтобы узнать что-то о данном смысле — например, какими словами можно выразить данное значение.

К

Компьютерная лексикография – это прикладная научная дисциплина в языкознании, изучающая методы использования компьютерной техники для составления словарей. Т. е. компьютерная лексикография как область прикладной лингвистики занимается созданием электронных словарей, лингвистических баз данных и разработкой программного обеспечения.

Конкорданс [англ. concordance - согласие, соответствие < лат. conncordare - согласовываться, приводить к согласию] – филол. 1) расположенный в алфавитном порядке перечень встречающихся в книге слов (или сходных по содержанию мест) с минимальным контекст (в несколько слов). Имеются к. многих значительных текстов: "Библии", сочинений Шекспира, Пушкина и др.; 2) особый тип словаря, в котором каждое слово приводится с минимальным контекстом. Нем. Konkordanz.

Словарь-конкорданс публицистики Ф.М. Достоевского http://dostoevskii.karelia.ru. Nave’s Topical Bible http://www.biblestudytools.com/concordances/naves-topical-bible/.

AntConc http://www.antlab.sci.waseda.ac.jp/software.html.

GlossaNet http://glossa.fltr.ucl.ac.be/.

Unitex http://www-igm.univ-mlv.fr/~unitex/.

Л

Лексикография (гр. lexikon словарь + ...графил) – 1) собирание слов какого-л, языка, приведение их в систему и издание в виде словаря, лексикона; словарное дело, составление словарей; 2) совокупность печатных трудов словарного типа, словарная литература.

Лингвистический словарь – 1) словарь, в котором дается разъяснение значения и употребления слов; 2) словарь, содержащий перечень слов естественного языка, отобранных в результате содержательного анализа текстов и систематизированных в соответствии с принятой классифицированной системой. Иногда для обозначения данного понятия используется термин идеологический словарь.

Н

Нелингвистический словарь – это словарь, в котором лексические единицы служат лишь отправной точкой для сообщения тех или иных сведений о предметах и явлениях вне языковой действительности.

О

Общий лингвистический словарь – примерами общих лингвистических словарей могут служить обычные толковые и переводные словари, охватывающие с той или иной степенью полноты всю лексику, бытующую в общенародном употреблении.

Общий нелингвистический словарь – энциклопедия.

Онтология – это попытка всеобъемлющей и детальной формализации некоторой области знаний с помощью концептуальной схемы.

П

Построение конкордансов – поиск примеров на употребление слова.

Практическая лексикография – процесс составления словарей различных типов на базе теоретических разработок.

С

Словарь конкордансов – включает примеры употребления всех слов в отдельном произведении или во всем творчестве писателя. Известны словари-конкордансы к поэмам О. Мандельштама [Koubourlis 1975], к поэзии А. Пушкина [Pushkin: A Concordance to the Poetry 1985]. Относительно недавно опубликован конкорданс к русскому варианту библии [Симфония или словарь-указатель к Священному Писанию Ветхого и Нового Завета 1988]

Словари сочетаемости – в практическом плане словари сочетаемости некоторого языка ориентированы в первую очередь на лиц, изучающих его в качестве иностранного, а также на тех, кто занимается переводом на этот язык, хотя они могут быть иногда полезными и для носителей данного языка, фактически выступая при этом в качестве разновидности словаря трудностей. Для русского языка наиболее полным на настоящий момент является «Словарь сочетаемости слов русского языка» под редакцией П. Н.Денисова и В. В. Морковкина (1978); существует также ряд учебных словарей сочетаемости русского языка: «Устойчивые словосочетания русского языка» К. В. Регининой, Г. П. Тюриной и Л. И. Широковой (1976), «Слово в тексте» Е. Г. Борисовой (1995) и др.

Словари трудностей – это словари, которые отражают разнообразные трудные случаи построения, употребления, произношения и написания языковых выражений. Из современных русских словарей такого типа наиболее известны «Трудности словоупотребления и варианты норм русского литературного языка» (под редакцией К. С. Горбачевича; 1973, около 8 тыс. слов) и «Словарь трудностей русского языка» Д. Э. Розенталя и М. А. Теленковой (6-е издание — 1987, около 30 тыс. слов).

Словари языковых форм – могут быть названы несколько различных типов словарей, в которых фиксируются в основном особенности формы слов и словосочетаний языка, тогда как их толкования либо отсутствуют вовсе, либо играют вспомогательную роль. Обычно словари подобного типа выполняют роль справочников, необходимых для правильного построения языковых выражений на том или ином языке.

Словарная статья – элементарной единица словаря; каждый отдельно взятый объект описания словаря и сопоставленные ему словарные характеристики.

Словарь, словаря, муж. – 1) книга, содержащая перечень слов, расположенных по тому или иному принципу (напр. по алфавиту), с теми или иными объяснениями. Англо-русский словарь (содержащий перевод англ. слов на русский язык). Латинский словарь (содержащий перевод лат. слов на какой-нибудь язык). Толковый словарь (содержащий толкование значений слов). Этимологический словарь (объясняющий происхождение слов). Энциклопедический словарь. Технический словарь. Словарь русских писателей (содержащий перечень писателей и биографические и библиографические сведения о них). 2) только ед. То же, что лексика. Словарь Пушника очень богат. Изучать словарь русского языка.

Словарь синонимов – это такой толковый словарь, в одной словарной статье которого помещаются близкие по значению слова-синонимические ряды. Словари синонимов появились достаточно давно: «Опыт словаря русских синонимов» П.Ф.Калайдовича (1818), содержавший 77 синонимических рядов. Толковаться в словаре синонимов может как весь ряд в целом, так и каждая лексема, входящая в ряд. По такому принципу построен двухтомный «Словарь синонимов русского языка» под редакцией А. П. Евгеньевой («Наука», 1970-1971). Некоторые словари синонимов не содержат толкований вообще (например, «Словарь синонимов русского языка» З. Е.Александровой, 1968).

Словник – структурный компонент словаря, который включает все единицы, которые формируют область описания словаря и являются входами словарных статей.

Специальный лингвистический словарь – это словарь, который разрабатывает какую-то одну область лексики, иногда достаточно широкую (например, фразеологический словарь, словарь иностранных слов), иногда же довольно узкую (например, словарь личных имен, даваемых новорожденным).

Специальный нелингвистический словарь – это специальная (отраслевая) энциклопедия (медицинская, юридическая и т. д.), краткий словарь той или иной области знания, биографический словарь деятелей той или иной страны («Who is who»).

Сценарий – типовая структура для некоторого действия, понятия, события и т.п., включающая характерные элементы этого действия, понятия, события.

Т

Таксон – любая совокупность слов, словосочетаний (и даже морфем), которым сопоставляется единое семантическое описание в терминах дескрипторов тезауруса. Иными словами, таксон – это множество единиц описания, объединенных в группу по единым семантическим основаниям любого уровня абстракции.

Тезаурус (от греч. ??????ό? — сокровище) в современной лингвистике — особая разновидность словарей общей или специальной лексики, в которых указаны семантические отношения (синонимы, антонимы, паронимы, гипонимы, гиперонимы и т. п.) между лексическими единицами. Таким образом, тезаурусы, особенно в электронном формате, являются одним из действенных инструментов для описания отдельных предметных областей.

В отличие от толкового словаря, тезаурус позволяет выявить смысл не только с помощью определения, но и посредством соотнесения слова с другими понятиями и их группами, благодаря чему может использоваться для наполнения баз знаний систем искусственного интеллекта.

В прошлом термином тезаурус обозначались по преимуществу словари, с максимальной полнотой представлявшие лексику языка с примерами её употребления в текстах.

Тезаурусы: Амара-коша (Словарь Амары) — первый и наиболее важный санскритский тезаурус (III—IV век); Первым тезаурусом в современном смысле слова стал английский Тезаурус Роже (XIX век, около 15000 синсетов); Викисловарь: многоязычный свободно пополняемый словарь и тезаурус (2004-наст.вр., проект фонда Викимедиа, в Русском Викисловаре (дамп — январь 2009) содержится 250 тыс. понятий, 67 тыс. отношений[1]); РуТез — тезаурус русского языка (был создан Центром информационных исследований как инструмент для автоматического индексирования; разрабатывается с 1997 года по настоящее время, 45 тыс. понятий, 107 тыс. слов и выражений, 177 тыс. отношений); «Писательский тезаурус» советского писателя С. Н. Есина.

Теоретическая лексикография – изучает вопросы разработки макроструктуры и микроструктуры словаря, разработку типологии словарей, историю развития лексикографии. Макроструктура словаря определяет отбор лексики, объём и характер словника, принципы расположения материала. Микроструктуры словаря определяет структуру словарной статьи, типы словарных определений, соотношение разных видов информации о слове, типы языковых иллюстраций.

Ф

Филиация – расчлененная подача значений той или иной вокабулы.

Фрейм – структура данных, предназначенная для представления стереотипной ситуации.

Э

Электронный словарь – словарь в компьютере или другом электронном устройстве. Позволяет быстро найти нужное слово, часто с учетом морфологии и возможностью поиска словосочетаний (примеров употребления), а также с возможностью изменения направления перевода (например, англо-русский или русско-английский). Внутренне устроен как база данных со словарными статьями. Электронные словари не стоит путать с компьютерными словарями, предназначенными не для пользователей, а для компьютерных программ, работающих с текстами на естественных языках.
Учебный текст
© perviydoc.ru
При копировании укажите ссылку.
обратиться к администрации