EN  |  RU  | 

Устный корпус ботлихского языка с. Ботлих



Корпус содержит устные тексты на ботлихском языке. Тексты были записаны в 2022 г. в с. Ботлих Ботлихского р-на респ. Дагестан. Село Ботлих относится к зоне распространения собственно ботлихского диалекта ботлихского языка, принадлежащего к андийской группе нахско-дагестанской языковой семьи.


К поиску


Транслитерация

Тексты Устного корпуса ботлихского языка записаны расширенной аварской (кириллической) орфографией, запись разбиения на морфемы сделана как кириллической орфографией, так и кавказоведческой транскрипцией. Кавказоведческая транскрипция основана на IPA с некоторыми различиями, указанными в таблице ниже.

IPA ts tsː ts’ ts’ː ʒ tʃː tʃ’ tʃ’ː ʃ ʃː tɫ’
В некоторых работах ʟ ʟ’
В корпусе c c’ c’ː čː č’ č’ː šː ƛ ƛ’

Соответствия между используемыми кириллической орфографией и кавказоведческой транскрипцией представлены в таблице.

кириллическая орфография кавказоведческая транскрипция комментарий пример
а a адам = adam ‘человек’
б b букӀи = buk’i ‘быть’
в w или v или ʷ w в исконных словах, v в русских заимствованиях (в соответствии с произношением), ʷ в некоторых исконных словах после букв согласных вацци = wacːi ‘брат’; вчера = včera ‘вчера’; гванзо = gʷanzo ‘хорошо’
г g гоб = gob ‘этот’
гӀ ʕ гӀамал = ʕamal ‘натура, характер’
гъ ʁ гъи = ʁi ‘приходить’
гь h гьудуллъи = hudulɬi ‘дружба’
д d ден = den ‘я’
дж ǯ встречается только в заимствованиях, например, из арабского и фарси джаваб = ǯawab ‘ответ’ (из арабского) ***
е (э) e э - обычно в начале слова или после гласных, е - в остальных позициях эхха = eχːa ‘потом’; лълъени = ɬːeni ‘вода’, наэ = nae ‘ходим’
ж жола = žola ‘ветка’
з z зив = ziv ‘день’
и i илӀи = iƛi ‘мы (инклюзивное)’
й j йацци = jacːi ‘сестра’
к k кумак = kumak ‘помощь’
кӀ k' кӀази = k’azi ‘платок’
кӀкӀ k'ː кӀкӀуркӀкӀун = k’ːurk’ːun ‘абрикос’
кк икки = ikːi ‘давать’
къ q' къвари = q’wari ‘хотеть’
кь ƛ’ кьони = ƛʼoni ‘много’
л l ла = la ‘и’
лӀ ƛ лӀирлӀи = ƛirƛi ‘масло’
лъ ɬ гьалъа = haɬa ‘здесь’
лълъ ɬː лълъени = ɬːeni ‘вода’
м m муса = musa ‘место’
н n в некоторых словах обозначает назализацию предыдущего гласного звука на = na ‘вещь’; гьингьу = hinhu (hiⁿhu) ‘груша’
о o орссу = orsːu ‘снаружи’
п p чурпа = čurpa ‘суп’
р r руша = ruša ‘дерево’
с s саъабу = saʔabu ‘поэтому’
сс ссеъа = sːeʔa ‘напротив’
т t талихӀ = taliħ ‘счастье’
тӀ t’ тӀабтӀалу = t’abt’alu ‘огурец’
у u уду = udu ‘там’
х χ хантӀа = χant’a ‘палка’
хӀ ħ хӀал = ħal ‘душа’
хх χː ххира = χːira ‘дорогой, родной’
хъ q хъвахъи = qwaqi ‘молоть’
хь x хьаги = xagi ‘кастрюля’
ц c цеб = ceb ‘один’
цӀ c' цӀебекъеру = c’ebeq’eru ‘кукуруза’
цӀцӀ c'ː цӀцӀай = c’ːaj ‘дождь’
цц инцци = incːi ‘весна’
ч чи = či ‘брать’
чӀ č’ чӀиквар = č’ikwar ‘красивый’
чӀчӀ č’ː чӀчӀабди = č’ːabdi ‘качать, втягивать (насосом)’
чч čː ччимди = čːimdi ‘какать’
ш реши = reši ‘год’
щ šː щикиб = šːikib ‘птица’
ъ ʔ саъи = saʔi ‘холодный’
ы ɨ только в русских заимствованиях или при смешении кодов, или при переключении кода на русский сливочный = slivočnɨj ‘сливочный’
ь ʲ (superscript) только в русских заимствованиях или при смешении кодов, или при переключении кода на русский уровень = urovenʲ ‘уровень’
ю ju, ʲu только в русских заимствованиях или при смешении кодов, или при переключении кода на русский извиняюсь = izvinʲajusʲ ‘извиняюсь’
я ja, ʲa только в русских заимствованиях или при смешении кодов, или при переключении кода на русский племянницабалъи = plemʲanicabaɬi ‘племянницы’

*** пример взят не из корпуса


В корпусе встречаются тексты, в которых произносятся русские слова без каких-либо признаков фонетической или грамматической адаптации, что можно трактовать как случаи или смешения кодов или переключения кода. Например: “ТӀиндида гьеа кашала… ой, извиняюсь… тӀиндида гьеа урбала.” В записи таких отрывков можно наблюдать использование букв русской орфографии, например: “ё”, “ю”, “я”, “ь”.


Как пользоваться корпусом

В этом разделе описываются инструкции по поиску в Устном корпусе ботлихского языка с. Ботлих (далее Корпус). Этот Корпус относится к группе корпусов, использующих поисковую платформу tsakorpus. Инструкция с описанием общих технических возможностей поиска в корпусах этого типа содержится в разделе «Справка» (кнопка с вопросительным знаком в правом верхнем углу страницы поиска). Здесь же описываются правила, специфические для данного Корпуса.

На основной странице поиска появляется форма с полями «Слово», «Лемма», «Грамматика» и «Глоссы».


Основные возможности поиска

Поиск точных форм («Слово»)

В этом поле можно ввести словоформы, вхождения которых вы хотите найти. Например, для поиска всех вхождений формы эргативного падежа лълъениди существительного лълъени ‘вода’ нужно задать в поле «Слово» словоформу лълъениди. Следует помнить, что ботлихские тексты записаны в корпусе в кириллической орфографии. Поиск по кавказоведческой транскрипции, соответственно, невозможен.

Запись в корпусе Запись леммы Запись с разбиением на морфемы кириллицей Запись с разбиением на морфемы кавказоведческой транскрипцией Глоссы Перевод леммы Язык
буккала букки б-укк-ала b-ukː-ala n-have_to-cond ‘have_to’ Botlikh

Об использовании регулярных выражений и других возможностях поиска по слову см. раздел Справка.


Поиск лексем («Лемма»)

Это поле следует использовать для поиска всех форм одного слова (лексемы, леммы). Например, если в это поле вбить слово лълъени (ɬːeni в кавказоведческой записи, ‘вода’), то в поисковой выдаче окажутся все вхождения этого существительного во всех его формах, например, лълъени ‘вода’, лълъениди [лълъени-ди, water-erg] ‘вода, водой’, лълъенилъа [лълъени-лъа, water-in.lat] ‘в воду’ и т.д.

Леммы следует вводить в поле поиска в начальной форме, т.е. в той же форме, которая обычно используется в ботлихских словарях. Для существительных, прилагательных, наречий, местоимений и числительных выбор начальной формы не вызывает сложностей (например, гьанкъу ‘дом’, зукӀкӀу ‘маленький’, гьена ‘сейчас’, мин ‘ты’, кӀеда ‘два’). Для глаголов в соответствии с традицией как правило используется форма среднего рода на б–, например, бакъащи ‘воровать’, букӀи ‘быть’ и т.д.

В Корпусе не проводится различие между словоизменением и словообразованием. В частности, формы, построенные по регулярным словообразовательным моделям, воспринимаются Корпусом как формы производящих лемм. Например, глагол, который в словарях трактуется как лексема мицӀцӀай ‘подсластить’, для Корпуса является формой каузатива от глагола мицӀцӀи ‘стать сладким’. Как следствие, по запросу мицӀцӀай в поле «Лемма» Корпус не выдаст результатов, а по запросу мицӀцӀи будут показаны как формы без показателя каузатива, так и формы с показателем каузатива. Чтобы получить только каузативные формы, можно сузить запрос, воспользовавшись полем «Глоссы».

Однако, если некаузативная форма глагола неизвестна, в поле «Лемма» в Корпусе представлен каузативный инфинитив. На данный момент таких глаголов четыре: бигъай “мешать”, билай “бросить”, гьигьирай “поливать”, хъабщадай “царапать”.

Для сложных или сложносоставных слов, а также для сокращений с копулой в поле «Лемма» в Корпусе последовательно представлены леммы всех составляющих через пробел, например, по запросу “гьаб цеб” Корпус показывает формы гьацеб, гьацебла, гьацел, гьацегъаб. Поскольку по техническим причинам tsakorpus ищет строгое соответствие запросу, то в поиске по одной лемме (напр. "гьаб" или “цеб”) не выдаются примеры со сложными и сложносоставными словами, также как и примеры с сокращенной копулой. Так, например, словоформу зукӏкӏуда можно получить по запросу “зукӏкӏу ида”, но не по запросам “зукӏкӏу” или “ида”. Данное неудобство отчасти решаемо при помощи использования регулярных выражений. Так, по запросу “зукӏкӏу*” в поле Лемма будут находиться и примеры с “зукӏкӏу”, и все примеры со сложными словами или сокращениями: “зукӏкӏуна // zuk’ːu=na” [small=thing], “зукӏкӏуда // zuk’ːu=da” [small=cop].


Грамматика

По техническим причинам поиск по «грамматике» пока не работает.

Система частей речи, используемая в Корпусе, расшифровывается в следующей таблице.

Условное обозначениеРасшифровкаКомментарий
nсуществительное
vглагол
copсвязка (копула)“являться”
adjприлагательное
advнаречиеСюда, в частности, причислены слова, которые могут использоваться и интерпретироваться и как наречия и как пространственно-временные послелоги, например, ссеъа “спереди, перед”. Ср.: раххас ссеъа кулонлалълъи “цепочка с кулоном спереди”, матӀучӀу ссеъа “перед зеркалом / у зеркала впереди”. Также слово эхха ‘потом’ отпределено как наречие независимо от контекста.
numчислительное
pronместоимение
demуказательное местоимение, демонстратив
prepпредлогКак собственно предлоги Корпус воспринимает только заимствования из русского языка.
postpпослелогПри этом местные наречные послелоги причислены к наречиям независимо от контекста (см. примеры выше, в строке adv).
conjсоюз
particleчастицаВ эту категорию попадают энклитики, но только в тех случаях, когда они произнесены через паузу от слова, и поэтому записываются как отдельные слова, например, ла ‘=add’, талу “=quot”. Однако в большинстве своем энклитики не вынесены отдельно и размечены внутри словоформ.
intjмеждометиеВ эту категорию попадают незнаменательные единицы, такие как валла ‘ага’, вай ‘ой-ой-ой’, хӀай! ‘Но!’(выкрикивает извозчик, погоняя лошадей), ворчӀами ‘здравствуй’, а также слова используемые для заполнения пауз в речи, например: гьабегье ‘вот’.
toponymгеографическое название места, топонимПоскольку часть топонимов является существительными (например: Москва ‘Москва’), а часть, исторически являясь локативной формой какой-то существительного (часто имени собственного), воспринимается как обстоятельство места (пример из словаря: Боржихе [Боржи-хе Borzhi(name)-apud] ‘в местности, что у Боржи’), было решено все топонимы объединить в единую отдельную категорию.
nameимена собственныевслед за топонимами было решено и имена собственные выделить отдельно

В разметке Корпуса частеречные пометы (тэги) ассоциируются с корнем словоформы. Как следствие, словоформа целиком идентифицируется Корпусом как относящаяся к той части речи, к которой отнесен ее корень. Наличие в словоформе аффиксов, меняющих частеречные свойства, не учитываются. Например, словоформа кӀвахӀалир [be_lazy-is-msd] ‘лень’ размечена как глагол (v), а не существительное (n), хотя по своим синтаксическим свойствам она ведет себя как существительное.

В случаях, когда в словоформе больше одного корня, частеречные пометы (тэги) ассоциируются со всеми корнями в составе словоформы. Например, словоформа гьацеб [dem-one-n] ‘вот этот’ // ‘this one’ размечена (dem, num).

Система грамматических признаков, используемых в Корпусе, представлена в следующей таблице.

Условное обозначение Расшифровка Основной (-ые) (алло)морф(ы) кириллицей Основной (-ые) (алло)морф(ы) кавказоведческой транскрипцией Примеры и комментарии
Число
pl множественное число -ал
-алу
-балъи
-далъи
-де
-ди


-малъи
-забалъи
-al
-alu
-baɬi
-daɬi
-de
-di
-e
-l
-maɬi
-zabaɬi
адамал // adam-al [person-pl] ‘люди’, гӀалибалъи // ʕali-baɬi [leaf-pl] ‘листья’, макве // makw-e [food-pl] ‘блюда’
gp общее множественное число (general plural) -r Скорее всего, заимствование из аварского
Класс
m мужской в w относится только к людям м.р.
ваъа // w-aʔ-a [m-go-aor] ‘поехал’
f женский й j относится только к людям ж.р.
цей // ce-j [one-f] ‘одна’
n неодушевленный б
м
b
m
цеб // ce-b [one-n] ‘одно’
iv четвертый (архаичный) р r има гучӀар заманди // ima gu-ča-r zaman-di [father сop=neg.prs.ptcp-iv time-erg] ‘во время, когда нет отца’ (нынче после смерти отца)
an.pl одушевленный во мн.ч. л
н
р
l
n
r
рорчӀами // r-orč’ami [an.pl-hello] ‘Здравствуйте!’
inan.pl неодушевленный во мн.ч. б b в корпусе не размечен
an одушевленный (в отрицательных причастиях) лъ ɬ игьилъичӀаб // ih-i-ɬ-i-č’a-b [do-is-an-is-neg.prs.ptcp-b] ‘не делающий’ ***
inan неодушевленный (в отрицательных причастиях) х χ къварихичӀаб // q’war-i-χ-i-č’a-b [need-is-inan-is-neg.prs.ptcp-n] ‘ненужное’
Косвенная основа
obl косвенная основа -а-
-у-
-a-
-u-
Появляется в именах между корнем и показателем падежа. Например, гьудулалъи // hudul-a-ɬi [ friend-obl-gen] ‘друга’
m.obl косвенная основа мужского рода -щу- -šːu-
гьущухеку // hu-šːu-χe-ku [dem-m.obl-apud-el] ‘от него’
nm.obl косвенная основа немужского рода -лълъи-
-лъи-
-ɬːi-
-ɬi-
гьулълъиди // hu-ɬːi-di [dem-nm.obl-erg] ‘это’
pl.obl косвенная основа имен во множественном числе -да-
-лу-
-da-
-lu-
гьулухеку // hu-lu-χe-ku [dem-pl.obl-apud-el] ‘от этих’, ‘от них’
Падеж
unmarked начальная форма (имени), абсолютив Это немаркированная по падежу форма имен; она используется в в функции абсолютива.
erg эргативный -ди -di Например: адамалуди ‘люди’ (в контексте “люди сожгли лес”); гъеруди ‘ложкой’ (в контексте ‘ложкой месить тесто’); цеб зивди ‘в один день’ (однажды)
gen родительный -лъи -ɬi гьудулалъи // hudul-a-ɬi [friend-obl-gen] ‘друга’
CM[gen] родительный -CM -CM Выражен показателем класса; ищиб // išːi-b [we.excl-n[gen]] ‘наше’
dat дательный
-ий
-j
-ij
дий // di-j [I.obl-dat] ‘мне’
Местные падежи
sup super, локализация на поверхности

-ди
-e
-u
-di
ахъулу // aqul-u [hearth-sup] ‘на очаге’
cont локализация в контакте с объектом -чӀу -č’u хьагичӀуку // xagi-č’u-ku [pan-cont-el] ‘от кастрюли’
apud локализация рядом с объектом -хе
-хи
-хъе
-хъи
-χe
-χi
-qe
-qi
гьущухеку // hu-šːu-χe-ku [dem-m.obl-apud-el] ‘от него’
in локализация внутри объекта -лъи
-лълъу
-лӀи
-ɬi
-ɬːu
-ƛi
рухьулъику // ruxu-ɬi-ku [forest-in-el] ‘из леса’
sub локализация под объектом -кьи -ƛʼi ахикьи // aχi-ƛʼi [garden-sub] ‘в саду’
lat латив, направление к объекту -a гьеа // he-a [above-lat] ‘наверх’
el элатив, направление от объекта -ку
-ру
-ku
-ru
рухьулъику // ruxu-ɬi-ku [forest-in-el] ‘из леса’
sup.lat суперлатив, сочетание локализации “на” с направлением “движение к” -a муха // muχ-a [work-sup.lat] ‘на работу’
apud.lat апудлатив, сочетание локализации “у” с направлением “движение к” -ха
-хъа
-χa
-qa
бекӏун-а-ха // bek’un-a-χa [corner-obl-apud.lat] ‘в угол’
in.lat инлатив, сочетание локализации “внутри” с направлением “движение к” -лъа
-лълъа
-ɬa
-ɬːa
рухьулъа // ruxu-ɬa [forest-in.lat] ‘в лес’
sub.lat сублатив, сочетание локализации “под” с направлением “движение к” -кьа -ƛʼa дордолакьа //dordol-a-ƛʼa [drain-obl-sub.lat]‘под водосток’ ***
Наклонение
imp императив
-ба

-á
-ba
-i
-j
йама // j-a<m>-a [f-go<n>-imp] ‘сходи’
juss юссив =ла =la гов гьивда арагьвабала // go-w hi-w=da araʁʷa-ba=la [dem-m self-m=int come-imp=juss] ‘Пусть он придет сюда.’ ***
opt оптатив -абу
-ибе
-abu
-ibe
мисибе // mis-ibe [find-opt] ‘пусть найдется!’
proh прохибитив -абасси -abasːi бетабасси // b-et-abasːi [n-leave-proh] ‘не оставляй’
cond условное наклонение -ала -ala цӀимдала // c’imd-ala [save-cond] ‘если сбережешь’
indef ирреалис (counterfactual) =хвала =χʷala хъвардухвала // qward-u=χʷala [write-aor=indef] ‘написал бы’; хъварду букӀахвала // qward-u b-uk’-a=χʷala [write-cvb n-be-aor=indef] ‘если бы написал’ ***
conc уступительное наклонение (concessive) -алала -alala ваншалала // w-anš-alala [m-tie-conc] ‘хоть привяжи’ (даже если привязать) ***
Время и финитность
aor аорист
-ив
-a
-iw
-u
миса // mis-a [find-aor] ‘нашёл’; икку // ikː-u [give-aor] ‘взял’
hab хабитуалис -e иде // id-e [love-hab] ‘люблю’
fut будущее -(и)кӀа-
-(и)кӀо-
-(i)kʼa-
-(i)k’o-
игьикӀаб // ih-i-k’a-b [do-is-fut-n] ‘сделаем’
inf инфинитив

-лъи
-i
-j
-ɬi
кьи // ƛʼ-i [say-inf] ‘сказать’
is инфинитивная основа -и-
-й-
-i-
-j-
йаихай йикӀа // j-a-i-χa-j j-ik’-a [f-go-is-inan.prs.ptcp-f f-be-aor] ‘ходила’
an.prs.ptcp причастие настоящего времени (одуш.) -лъа- -ɬa- йанхилъай //j-an χ-i-ɬa-j [f-get_pregnant-is-an.prs.ptcp-f] ‘беременная’ ***
inan.prs.ptcp причастие настоящего времени (неодуш.) -ха-
-хо-
-χa-
-χo-
гъихал рукӀа // ʁ-i-χa-l r-uk’-a [come-is-inan.prs.ptcp-an.pl an.pl-be-aor] ‘приходили’ [imperfect]
an.fut.ptcp причастие будущего времени (одуш.) -лъа- -ɬa- ида йаъилъай // ida j-aʔ-i-ɬa-j [cop f-go-is-an.fut.ptcp-f] ‘пойду’
inan.fut.ptcp причастие будущего времени (неодуш.) -ха-
-хо-
-χa-
-χo-
букӀихоб // b-uk’-i-χo-b [n-be-inf-inan.fut.ptcp-n] ‘будущий’ ***
pst.ptcp причастие прошедшего времени -а- -a- букӀаб ида // b-uk’-a-b ida [n-be-pst.ptcp-n cop] ‘был’
cvb основное деепричастие (конверб)
-ив
-a
-iw
-u
хадуда // χad-u=da [ask-cvb=cop[prf]] ‘спросила’
prog прогрессивный конверб
-ата
-ат
-a
-ata
-at
бижата // b-iž-ata [n-grow-prog] ‘растут’; масатида // mas-at=ida [tell-prog=cop] ‘рассказываю’
temp темпоральный конверб (temporal converb) -руди
-ригьуди
-риуди
-rudi
-rihudi
-riudi
булӀаруди // b-uƛ-a-rudi [n-finish-th-temp] ‘закончив’; также не с глаголами: горуди = go-rudi [dem-temp] ‘в то время’, ‘тогда’
until “до тех пор пока не” (лексический глосс) =дера =dera мигьидера // mih-i=dera [boil-inf=until] ‘пока (не) сварится’
msd масдар, отглагольное существительное -r мицӀцӀар //mic’ː-a-r [become_tasty-caus-msd] ‘сладость’
Валентность глагола
caus каузатив -а- -a- бигъайла // b-iʁ-a-j=la [n-mix-caus-inf=add] ‘и перемешиваю’
caus.aor каузативный аорист -o идо // id-o [love-caus] ‘понравилось’
caus.cvb каузативный конверб -o къваро маси // q’war-o mas-i [need-caus.cvb tell-inf] ‘хочу рассказать’
Отрицание
neg отрицание -чӀ-
-чӀу
-č’-
-č’u
бегъечӀу // b-eʁ-e-č’u [n-know-hab-neg] ‘не знаю’
neg.aor отрицательный аорист -чӀа
-чӀи
-č’a
-č’i
букӀичӀама // b-uk’-i-č’a=ma [n-be-is-neg.aor=pq] ‘Не было ли?’, ‘Не так ли?’
neg.cvb отрицательный конверб -чӀа -č’a цӀатайчӀа букӀи // c’at-a-j-č’a b-uk’-i [burn-caus-is-neg.cvb n-be-inf] ‘(чтобы) не обжечь’
neg.prog отрицательный прогрессивный конверб -чӀада -č’ada бегъичӀада // b-eʁ-i-č’ada [n-know-is-neg.prog] ‘не зная’
neg.cond отрицательное условие -чӀала -č’ala мисичӀала // mis-i-č’ala [find-is-neg.cond] ‘если не найти’
neg.prs.ptcp отрицательное причастие настоящего времени -чӀа- -č’a- къварихичӀаб // q’war-i-χ-i-č’a-b [need-is-inan-is-neg.prs.ptcp-n] ‘ненужное’
Иллокутивные маркеры Вопросительные частицы
an.cq одуш. вопросительная частица (animate content question particle) =лъи.ла =ɬi.la эпилъила // epi=ɬi.la [why=an.cq] ‘Зачем?’
an.pq одуш. полярная вопросительная частица (animate polar question particle) =лъи.ма =ɬi.ma гьинулъимахикӀул // hinu=ɬi.ma=χi=k’ul [inside=an.pq=?=quot] ‘внутри что ли’ (про ослов во дворе)
cq вопросительная частица (content question particle) =ла =la эбла // e-b=la [what-n=cq] ‘что’
inan.cq вопросительная частица (inanimate content question marker) =ху.ла =χu.la эбхула // e-b=χu.la [what-n=inan.cq] ‘Что?’
inan.pq вопросительная полярная частица (inanimate polar question marker) =ху.ма =χu.ma батӀебхума // bat’e-b=χu.ma [different-n=inan.pq] ‘Другой что ли?’
pq вопросительная полярная частица (polar question particle) =ма =ma букӀичӀама // b-uk’-ič’a=ma [n-be-neg.aor=pq] ‘Не было ли?’, ‘Не так ли?’
Передача чужой речи
quot цитатная частица (quotative particle) =талу
=кӀул
=talu
=k’ul
“Дийла икка, ила, буршималъи!” талу гьикьуда йешилълъиди // di-j=la ikː-a ila burši-maɬi =talu hiƛʼ-u=da ješi-ɬːi-di [I.obl-dat=add give-imp mother pie-pl =quot say-cvb=cop[prf] daughter-nm.obl-erg] ‘Дай мне тоже лепешек, мама! - сказала дочка.’
rep слух (reportative particle) =хвата =χʷata Используется для передачи информации, основанной на слухах (used to indicate that a statement is based on hearsay); дийхвата // di-j=χwata [I.obl-dat=rep] ‘для меня, говорят, …”
Деривация существительных
? словообразовательный суффикс, образующий статусные существительные (status nouns) -лъи -ɬi гьудуллъи // hudul-ɬi [friend-?] ‘дружба’
agn имя деятеля (agent nominalization) -хъан -qan мацӀцӀихъан // mac’ː-i-qan [ask-is-agn] ‘сплетник, ябеда’ ***
? в сочетании с суффиксом множественного числа используется для образования фамилий (collective family names) -ххан -χːan Мирзаххандул // Mirza-χːan-dul [Mirza-?-pl] ‘Мирзаевы/ семья (род) Мирзы’ ***
Деривация прилагательных и наречий
comp сравнительная частица =гъу =ʁu анзигъу // anzi=ʁu [snow=comp] ‘как снег’ ***
simil симилатив (подобие) =ццу-
-ерхи
=cːu-
-erχi
вацциццув // w-acːi=cːu-w [m-sibling=simil-m] ‘как брат’
eq экватив (equative) =гъвана =ʁʷana кавугъвана // kawu=ʁʷana [gate=eq] ‘как ворота’ ***
atr атрибутивная частица =кӀо
=ссу-
=k’o
=sːu-
гьатакӀоруди // h-ata=k’o-rudi [do-prog=atr-temp] ‘когда работает’; Буйхессуб // Bujχe-sːu-b [Botlikh[toponym]=atr-n] ‘ботлихский(-ая)’
an.atr атрибутивная частица (одуш.) =лъа- =ɬa- used to attributivize progressive converbs and a handful of other constituents; гьингъалъал // hi<n>ʁ-a=ɬa-l [come<an.pl>-prog.cvb=an.atr-an.pl] ‘приехавшие’
inan.atr атрибутивная частица (неодуш.) =хо- =χo- used to attributivize progressive converbs and a handful of other constituents; игьатахоб // ih-ata=χo-b [do-prog=inan.atr-n] ‘готовящийся’
restr ограничительная частица (restrictive particle) =гъа-
=гъо-
=ʁa-
=ʁo-
гоцегъов // go-ce-ʁo-w [dem-one=restr-m] ‘(из какой-то группы) вот этот вот (конкретный)’
adv адвербиализатор (adverbializer)
-лъа
-a
-ɬːa
-o
-
гванзо // gʷanz-o [good-adv] ‘хорошо’
Деривация числительных
num числительное -да -da кӀеда // k’eda [two-num] ‘два’
lnk связывающий элемент числительных (numeral linking morpheme) -лъи
-чӀуекӀу
-ɬi
-čʼukʼu
гьацӀлъи гьакьуда // hac’-ɬi haƛʼu-da [ten-lnk seven-num] ‘семнадцать’
an.ord одуш. порядковое (animate ordinal) -лъа- -ɬa- кӀейилъаб зини //k’e-ji-ɬa-b [two-th-an.ord-n] ‘вторая корова’ ***
inan.ord неодуш. порядковое (inanimate ordinal) -хо- -χo- гьакьуйхоб // haƛʼu-j-χo-b [seven-th-inan.ord-n] ‘седьмой’
fract дробное fractional numeral -ркьа -rƛʼa кӀеркьа // k’e-rƛʼa [two-fract] ‘надвое, на две (части)’ ***
mult мультипликативное (multiplicative numeral) -цӀи
-рцӀи
-c’i
-rc’i
гьабцӀи // hab-c’i (‘трижды’) ***
ten “десять” (лексический глосс) -цӀали- -cʼali- Образует числительные от 20 до 90. бикьицӀалида // biƛʼi-c’ali-da [eight-ten-num] ‘80’ ***
ten.lnk сочетание суффикса “десять” со связующим элементом -цӀай -c’aj Сочетание суффиксов -c’ali-ɬi (-ten-lnk) иногда сокращается до -c’aj.
Глагольная деривация
vbz показатель вербализации (verbalizer)
-ела
-кӀва
-ку
-са
-хху
-лъ-
-d
-ela
-k’ʷa
-ku
-sa
-χːu
-ɬ-
хӀайди // ħaj-d-i [hup-vbz-inf] ‘нокать, погонять’ (т.е. подгонять ослов, лошадей, от междометия хӀай ‘Но!’)
Тематические маркеры
th тематический элемент (thematic element) -а-
-й-
-a-
-j-
булӀаруди // b-uƛ-a-rudi [n-finish-th-temp] ‘закончив’; гьакьуйхоб // haƛʼu-j-χo-b [seven-th-inan.ord-n] ‘седьмой’
Другие частицы и клитики
add аддитивная частица =ла =la денла // den=la [I=add] ‘я тоже’
comit комитатив =лълъи =ɬːi лълъенилълъи // ɬːeni=ɬːi [water=comit] ‘с водой’
aux вспомогательный глагол =мал-
=малигь-
=mal-
=malih-
гьибцӀамале // hibc’-a=mal-e [fill-caus(inf)=aux-hab] ‘наполняю’ (сокращенное от “гьибцӀай мале”)
even ‘даже’ (лексический глосс) =дала =dala миндала // min=dala [you.sg=even] ‘ты же’
func “в качестве …” (functive) =лъун =ɬun обозначает роль субъекта; мугӀалим=лъун // muʕalim=ɬun [teacher=func] ‘в качестве учителя’ ***
indef неопределенное (indefinite particle) =хвала
=гӀала
=кӀвала
=χʷala
=ʕalla
=kʼʷala
инндакӀвала // inda=kʼʷala [when=indef] ‘никогда’
int усилительная частица (intensifying particle) =да =da дуйда // du-j=da [you.sg.obl-dat=int] ‘тебе же’
ptc усилительная частица (emphatic particle) =хха
=ха
=χːa
=χa
переводится русской усилительной частицей же; бухичӀамахха // buχ-i-č’a=ma=χːa [take-is-neg.aor=pq=?] ‘разве же не забрали?; рукӀеха // r-uk’-e=χa [an.pl-be-hab=ptc] ‘живем же’
cop связка, копула =да
=ида
=da
=ida
масатида // mas-at=ida [tell-prog=cop] ‘рассказываю’ (сокращенное от “масата ида”); инчуда // inču=da [apple=cop] ‘яблоня есть’ (сокращенное от “инчу ида”)
towards ‘по направлению к’ (лексический глосс) =ду
=ххинду
=du
=χːindu
рухьулъаххинду // ruxu-ɬa=χːindu [mountain-in.lat=towards] ‘в сторону горы’ ***
? все непонятное

*** примеров данных явлений в корпусе пока нет, поэтому примеры взяты из других источников


Примечание. Для времени “perfect”, образуемым VERB-cvb=cop (сокращенно произносимым носителями VERB=cop с ударением на корень) и времени “intentional future”, образуемым VERB-is=cop(сокращенно произносимым носителями также VERB=cop, но с ударением на “и” в “ида”), было решено ввести особые глоссы: VERB-cvb=cop[prf] (в сокращенном варианте VERB=cop[prf]), см. пример (1) и VERB-is=cop[fut] (в сокращенном варианте VERB=cop[fut]), см. пример (2), следуя логике принятого для ботлихского языка способа глоссирования родительного падежа маркируемого маркером класса (-CM[gen]).

(1) Цеб зивди илуди хадуда гьулълъихи:
це-б зив-ди ил-у-ди хад-у=да гьу-лълъи-хи
ce-b ziw-di il-u-di χad-u=da hu-ɬːi-χi
one-n day-erg mother-obl-erg ask-cvb=cop[prf] dem-nm.obl-apud
“В один день мать попросила ее:”

(2) Мигьидера бетида.
мигь-и=дера б-ет=ида
mih-i=dera b-et=ida
boil-inf=until n-leave=cop[fut]
“Оставим пока сварится.”

Личные местоимения имеют лексические глоссы

Условное обозначение Запись кириллицей Запись латиницей Комментарии
I ден den
I.erg ишкур iškur
I.obl ди- di-
I.obl.dat ди di сокращенное от ди-й // di-j [I.obl-dat]
we.incl илӀи iƛi
we.excl ищи išːi
you.sg мин min
you.sg.obl ду- du-
you.sg.obl.dat ду du сокращенное от ду-й // du-j [you.sg.obl-dat]
you.pl бишти bišti

Глоссы

Поиск по глоссам позволяет создавать запросы, касающиеся морфемной структуры словоформ.

1. Общие принципы работы поиска по глоссам приводятся в разделе «Справка» (кнопка с вопросительным знаком в правом верхнем углу страницы поиска).

2. При поиске по глоссам не находятся такие словоформы, при глоссировании которых релевантные части словоформ не членятся на морфемы. Например, словоформа эргативного падежа местоимения ден ‘я’ выглядит как ишкур, не членится на морфемы и глоссируется целиком как I.erg. Эта словоформа попадает в выдачу по грамматическому запросу «erg», но при поиске по глоссам она не попадает в выдачу по запросу «STEM-ERG». При этом, если в поиске по глоссам запросить конкретныую форму, например, «I.erg», то в результат попадут все такие примеры.

3. Для поиска “всего непонятного”, глоссированного вопросительным знаком “?”, в поиске по глоссам необходимо вводить не “?”, а “??” или “\?”.

4. Поскольку tsakorpus не поддерживает квадратные и угловые скобки, при глоссировании интерфиксов (например, и<б>х-и //i<b>χ-i [take<n>-inf] ‘взять’), родительного падежа, выраженного классными показателями (например, ищиб // išːi-b [we.excl-n[gen]] ‘наше’), и т.п. были использованы круглые скобки. Таким образом, глоссы для словоформ “взять” и “наше” в Корпусе выглядят так: take(n)-inf и we.excl-n(gen).

5. Поиск глоссов, содержащих скобки, например, интерфиксов, на данный момент затруднен по техническим причинам. Так, например, при поиск примеров использования показателя класса, глоссируемого “n”, при запросе “n” по полю “Глосс” Корпус выдаёт употребления с интерфиксами, однако, примеры с классовым родительным падежом, например we.incl-n(gen), Корпус не выдает. Для поиска таких примеров запрос необходимо экранировать:

Для поиска примеров с “cop(fut)” в поиск по “Глоссам” вбивать следует “cop\(fut\)”.


Перевод

При помощи этого поля возможен поиск словоформ в соответствии с английским переводом соответствующих лемм. Например, по запросу «do» в поле «Перевод (eng)» выдаются все употребления глагола игьи, корень которого глоссируется в корпусе как «do». Поиск по переводу не позволяет искать русские или английские словоформы, использованные в переводах ботлихских предложений. Например, при помощи этой функции нельзя найти все предложения, в переводах которых используется словоформа «сделали». Чтобы найти такие предложения, необходимо воспользоваться полнотекстовым поиском.


Язык

Каждой словоформе в корпусе, за исключением имён собственных, добавлена пометка “language”, отражающая язык (или язык-источник) или всей словоформы или ее составляющих. Так, словоформу специябалъила // specija-baɬi=la [spice(RUS)-pl=add] ‘и специи’ можно найти по пометам “Russian, Botlikh”, “Russian” или “Botlikh” в графе “язык (language)”.

Поиск возможен по тегам Botlikh, Russian, Avar, Arabic.


Состав корпуса

Общие сведения. В корпусе содержится 12 текстов общей продолжительностью чуть более 20 минут, объем корпуса чуть более 1500 слов.

Социолингвистические характеристики. Тексты корпуса были записаны от 12 носителей разных поколений, от 1957 до 2010 г.р.

Распределение текстов по годам рождения носителей и количеству слов по жанрам текстов показано в графике ниже.


Распределение текстов по годам рождения носителей показано в таблице.

Год рожденияКоличество носителейПродолжительность текстов (в секундах)
1957–19601260
1961-19706708
1971–19802163
1981–199016
1991–200000
2001–20102178

Жанровый состав. В основном в корпус входят полуспонтанные монологические тексты, есть один вотсап диалог. В таблице ниже отражен жанрово-тематический состав текстов в секундах записей.

Жанр Количество текстов Продолжительность текстов в секундах
Рецепты 3 229
(Авто)биографии 1 102
Истории из жизни 2 151
Легенды и сказки 2 120
Пословицы 1 260
Описания 2 275
Диалоги 1 170

Создатели

Тексты, вошедшие в корпус, были записаны и расшифрованы в 2022–2023 гг. Международной лабораторией языковой конвергенции Высшей Школы Экономики (НИУ ВШЭ).

В работе над корпусом участвовали Самира Верхеес, Сара Задыкян и Кьяра Наккарато.

Помощь в расшифровке текстов на ботлихском языке оказали жители с. Ботлих, прежде всего Алиева Х.А., Кадырова М.А., Мажидова С.М.. С расшифровкой аварских включений также помогала Газимагомедова П. Б.


Контакты

По содержательным вопросам:
Сара Задыкян: zadykian@gmail.com

По техническим вопросам:
Илья Садаков: saltymon@gmail.com


Как процитировать корпус

Если Вы используете данные Корпуса в своём исследовании, воспользуйтесь следующей ссылкой:

Сара Задыкян, Кьяра Наккарато, Самира Ферхеес, Илья Садаков. Устный корпус ботлихского языка с. Ботлих. М.: Международная лаборатория языковой конвергенции, НИУ ВШЭ. (Доступно онлайн по адресу: http://lingconlab.ru/botlikh/, дата обращения .)