Корпус содержит устные тексты на ботлихском языке. Тексты были записаны в 2022 г. в с. Ботлих Ботлихского р-на респ. Дагестан. Село Ботлих относится к зоне распространения собственно ботлихского диалекта ботлихского языка, принадлежащего к андийской группе нахско-дагестанской языковой семьи.
Тексты Устного корпуса ботлихского языка записаны расширенной аварской (кириллической) орфографией, запись разбиения на морфемы сделана как кириллической орфографией, так и кавказоведческой транскрипцией. Кавказоведческая транскрипция основана на IPA с некоторыми различиями, указанными в таблице ниже.
IPA | ts | tsː | ts’ | ts’ː | ʒ | tʃ | tʃː | tʃ’ | tʃ’ː | ʃ | ʃː | tɫ | tɫ’ |
В некоторых работах | ʟ | ʟ’ | |||||||||||
В корпусе | c | cː | c’ | c’ː | ž | č | čː | č’ | č’ː | š | šː | ƛ | ƛ’ |
Соответствия между используемыми кириллической орфографией и кавказоведческой транскрипцией представлены в таблице.
кириллическая орфография | кавказоведческая транскрипция | комментарий | пример |
---|---|---|---|
а | a | адам = adam ‘человек’ | |
б | b | букӀи = buk’i ‘быть’ | |
в | w или v или ʷ | w в исконных словах, v в русских заимствованиях (в соответствии с произношением), ʷ в некоторых исконных словах после букв согласных | вацци = wacːi ‘брат’; вчера = včera ‘вчера’; гванзо = gʷanzo ‘хорошо’ |
г | g | гоб = gob ‘этот’ | |
гӀ | ʕ | гӀамал = ʕamal ‘натура, характер’ | |
гъ | ʁ | гъи = ʁi ‘приходить’ | |
гь | h | гьудуллъи = hudulɬi ‘дружба’ | |
д | d | ден = den ‘я’ | |
дж | ǯ | встречается только в заимствованиях, например, из арабского и фарси | джаваб = ǯawab ‘ответ’ (из арабского) *** |
е (э) | e | э - обычно в начале слова или после гласных, е - в остальных позициях | эхха = eχːa ‘потом’; лълъени = ɬːeni ‘вода’, наэ = nae ‘ходим’ |
ж | ž | жола = žola ‘ветка’ | |
з | z | зив = ziv ‘день’ | |
и | i | илӀи = iƛi ‘мы (инклюзивное)’ | |
й | j | йацци = jacːi ‘сестра’ | |
к | k | кумак = kumak ‘помощь’ | |
кӀ | k' | кӀази = k’azi ‘платок’ | |
кӀкӀ | k'ː | кӀкӀуркӀкӀун = k’ːurk’ːun ‘абрикос’ | |
кк | kː | икки = ikːi ‘давать’ | |
къ | q' | къвари = q’wari ‘хотеть’ | |
кь | ƛ’ | кьони = ƛʼoni ‘много’ | |
л | l | ла = la ‘и’ | |
лӀ | ƛ | лӀирлӀи = ƛirƛi ‘масло’ | |
лъ | ɬ | гьалъа = haɬa ‘здесь’ | |
лълъ | ɬː | лълъени = ɬːeni ‘вода’ | |
м | m | муса = musa ‘место’ | |
н | n | в некоторых словах обозначает назализацию предыдущего гласного звука | на = na ‘вещь’; гьингьу = hinhu (hiⁿhu) ‘груша’ |
о | o | орссу = orsːu ‘снаружи’ | |
п | p | чурпа = čurpa ‘суп’ | |
р | r | руша = ruša ‘дерево’ | |
с | s | саъабу = saʔabu ‘поэтому’ | |
сс | sː | ссеъа = sːeʔa ‘напротив’ | |
т | t | талихӀ = taliħ ‘счастье’ | |
тӀ | t’ | тӀабтӀалу = t’abt’alu ‘огурец’ | |
у | u | уду = udu ‘там’ | |
х | χ | хантӀа = χant’a ‘палка’ | |
хӀ | ħ | хӀал = ħal ‘душа’ | |
хх | χː | ххира = χːira ‘дорогой, родной’ | |
хъ | q | хъвахъи = qwaqi ‘молоть’ | |
хь | x | хьаги = xagi ‘кастрюля’ | |
ц | c | цеб = ceb ‘один’ | |
цӀ | c' | цӀебекъеру = c’ebeq’eru ‘кукуруза’ | |
цӀцӀ | c'ː | цӀцӀай = c’ːaj ‘дождь’ | |
цц | cː | инцци = incːi ‘весна’ | |
ч | č | чи = či ‘брать’ | |
чӀ | č’ | чӀиквар = č’ikwar ‘красивый’ | |
чӀчӀ | č’ː | чӀчӀабди = č’ːabdi ‘качать, втягивать (насосом)’ | |
чч | čː | ччимди = čːimdi ‘какать’ | |
ш | š | реши = reši ‘год’ | |
щ | šː | щикиб = šːikib ‘птица’ | |
ъ | ʔ | саъи = saʔi ‘холодный’ | |
ы | ɨ | только в русских заимствованиях или при смешении кодов, или при переключении кода на русский | сливочный = slivočnɨj ‘сливочный’ |
ь | ʲ (superscript) | только в русских заимствованиях или при смешении кодов, или при переключении кода на русский | уровень = urovenʲ ‘уровень’ |
ю | ju, ʲu | только в русских заимствованиях или при смешении кодов, или при переключении кода на русский | извиняюсь = izvinʲajusʲ ‘извиняюсь’ |
я | ja, ʲa | только в русских заимствованиях или при смешении кодов, или при переключении кода на русский | племянницабалъи = plemʲanicabaɬi ‘племянницы’ |
*** пример взят не из корпуса
В корпусе встречаются тексты, в которых произносятся русские слова без каких-либо признаков фонетической или грамматической адаптации, что можно трактовать как случаи или смешения кодов или переключения кода. Например: “ТӀиндида гьеа кашала… ой, извиняюсь… тӀиндида гьеа урбала.” В записи таких отрывков можно наблюдать использование букв русской орфографии, например: “ё”, “ю”, “я”, “ь”.
В этом разделе описываются инструкции по поиску в Устном корпусе ботлихского языка с. Ботлих (далее Корпус). Этот Корпус относится к группе корпусов, использующих поисковую платформу tsakorpus. Инструкция с описанием общих технических возможностей поиска в корпусах этого типа содержится в разделе «Справка» (кнопка с вопросительным знаком в правом верхнем углу страницы поиска). Здесь же описываются правила, специфические для данного Корпуса.
На основной странице поиска появляется форма с полями «Слово», «Лемма», «Грамматика» и «Глоссы».
В этом поле можно ввести словоформы, вхождения которых вы хотите найти. Например, для поиска всех вхождений формы эргативного падежа лълъениди существительного лълъени ‘вода’ нужно задать в поле «Слово» словоформу лълъениди. Следует помнить, что ботлихские тексты записаны в корпусе в кириллической орфографии. Поиск по кавказоведческой транскрипции, соответственно, невозможен.
Запись в корпусе | Запись леммы | Запись с разбиением на морфемы кириллицей | Запись с разбиением на морфемы кавказоведческой транскрипцией | Глоссы | Перевод леммы | Язык |
---|---|---|---|---|---|---|
буккала | букки | б-укк-ала | b-ukː-ala | n-have_to-cond | ‘have_to’ | Botlikh |
Об использовании регулярных выражений и других возможностях поиска по слову см. раздел Справка.
Это поле следует использовать для поиска всех форм одного слова (лексемы, леммы). Например, если в это поле вбить слово лълъени (ɬːeni в кавказоведческой записи, ‘вода’), то в поисковой выдаче окажутся все вхождения этого существительного во всех его формах, например, лълъени ‘вода’, лълъениди [лълъени-ди, water-erg] ‘вода, водой’, лълъенилъа [лълъени-лъа, water-in.lat] ‘в воду’ и т.д.
Леммы следует вводить в поле поиска в начальной форме, т.е. в той же форме, которая обычно используется в ботлихских словарях. Для существительных, прилагательных, наречий, местоимений и числительных выбор начальной формы не вызывает сложностей (например, гьанкъу ‘дом’, зукӀкӀу ‘маленький’, гьена ‘сейчас’, мин ‘ты’, кӀеда ‘два’). Для глаголов в соответствии с традицией как правило используется форма среднего рода на б–, например, бакъащи ‘воровать’, букӀи ‘быть’ и т.д.
В Корпусе не проводится различие между словоизменением и словообразованием. В частности, формы, построенные по регулярным словообразовательным моделям, воспринимаются Корпусом как формы производящих лемм. Например, глагол, который в словарях трактуется как лексема мицӀцӀай ‘подсластить’, для Корпуса является формой каузатива от глагола мицӀцӀи ‘стать сладким’. Как следствие, по запросу мицӀцӀай в поле «Лемма» Корпус не выдаст результатов, а по запросу мицӀцӀи будут показаны как формы без показателя каузатива, так и формы с показателем каузатива. Чтобы получить только каузативные формы, можно сузить запрос, воспользовавшись полем «Глоссы».
Однако, если некаузативная форма глагола неизвестна, в поле «Лемма» в Корпусе представлен каузативный инфинитив. На данный момент таких глаголов четыре: бигъай “мешать”, билай “бросить”, гьигьирай “поливать”, хъабщадай “царапать”.
Для сложных или сложносоставных слов, а также для сокращений с копулой в поле «Лемма» в Корпусе последовательно представлены леммы всех составляющих через пробел, например, по запросу “гьаб цеб” Корпус показывает формы гьацеб, гьацебла, гьацел, гьацегъаб. Поскольку по техническим причинам tsakorpus ищет строгое соответствие запросу, то в поиске по одной лемме (напр. "гьаб" или “цеб”) не выдаются примеры со сложными и сложносоставными словами, также как и примеры с сокращенной копулой. Так, например, словоформу зукӏкӏуда можно получить по запросу “зукӏкӏу ида”, но не по запросам “зукӏкӏу” или “ида”. Данное неудобство отчасти решаемо при помощи использования регулярных выражений. Так, по запросу “зукӏкӏу*” в поле Лемма будут находиться и примеры с “зукӏкӏу”, и все примеры со сложными словами или сокращениями: “зукӏкӏуна // zuk’ːu=na” [small=thing], “зукӏкӏуда // zuk’ːu=da” [small=cop].
По техническим причинам поиск по «грамматике» пока не работает.
Система частей речи, используемая в Корпусе, расшифровывается в следующей таблице.
Условное обозначение | Расшифровка | Комментарий |
n | существительное | |
v | глагол | |
cop | связка (копула) | “являться” |
adj | прилагательное | |
adv | наречие | Сюда, в частности, причислены слова, которые могут использоваться и интерпретироваться и как наречия и как пространственно-временные послелоги, например, ссеъа “спереди, перед”. Ср.: раххас ссеъа кулонлалълъи “цепочка с кулоном спереди”, матӀучӀу ссеъа “перед зеркалом / у зеркала впереди”. Также слово эхха ‘потом’ отпределено как наречие независимо от контекста. |
num | числительное | |
pron | местоимение | |
dem | указательное местоимение, демонстратив | |
prep | предлог | Как собственно предлоги Корпус воспринимает только заимствования из русского языка. |
postp | послелог | При этом местные наречные послелоги причислены к наречиям независимо от контекста (см. примеры выше, в строке adv). |
conj | союз | |
particle | частица | В эту категорию попадают энклитики, но только в тех случаях, когда они произнесены через паузу от слова, и поэтому записываются как отдельные слова, например, ла ‘=add’, талу “=quot”. Однако в большинстве своем энклитики не вынесены отдельно и размечены внутри словоформ. |
intj | междометие | В эту категорию попадают незнаменательные единицы, такие как валла ‘ага’, вай ‘ой-ой-ой’, хӀай! ‘Но!’(выкрикивает извозчик, погоняя лошадей), ворчӀами ‘здравствуй’, а также слова используемые для заполнения пауз в речи, например: гьабегье ‘вот’. |
toponym | географическое название места, топоним | Поскольку часть топонимов является существительными (например: Москва ‘Москва’), а часть, исторически являясь локативной формой какой-то существительного (часто имени собственного), воспринимается как обстоятельство места (пример из словаря: Боржихе [Боржи-хе Borzhi(name)-apud] ‘в местности, что у Боржи’), было решено все топонимы объединить в единую отдельную категорию. |
name | имена собственные | вслед за топонимами было решено и имена собственные выделить отдельно |
В разметке Корпуса частеречные пометы (тэги) ассоциируются с корнем словоформы. Как следствие, словоформа целиком идентифицируется Корпусом как относящаяся к той части речи, к которой отнесен ее корень. Наличие в словоформе аффиксов, меняющих частеречные свойства, не учитываются. Например, словоформа кӀвахӀалир [be_lazy-is-msd] ‘лень’ размечена как глагол (v), а не существительное (n), хотя по своим синтаксическим свойствам она ведет себя как существительное.
В случаях, когда в словоформе больше одного корня, частеречные пометы (тэги) ассоциируются со всеми корнями в составе словоформы. Например, словоформа гьацеб [dem-one-n] ‘вот этот’ // ‘this one’ размечена (dem, num).
Система грамматических признаков, используемых в Корпусе, представлена в следующей таблице.
Условное обозначение | Расшифровка | Основной (-ые) (алло)морф(ы) кириллицей | Основной (-ые) (алло)морф(ы) кавказоведческой транскрипцией | Примеры и комментарии |
---|---|---|---|---|
Число | ||||
pl | множественное число | -ал -алу -балъи -далъи -де -ди -е -л -малъи -забалъи … |
-al -alu -baɬi -daɬi -de -di -e -l -maɬi -zabaɬi … |
адамал // adam-al [person-pl] ‘люди’, гӀалибалъи // ʕali-baɬi [leaf-pl] ‘листья’, макве // makw-e [food-pl] ‘блюда’ |
gp | общее множественное число (general plural) | -р | -r | Скорее всего, заимствование из аварского |
Класс | ||||
m | мужской | в | w | относится только к людям м.р. ваъа // w-aʔ-a [m-go-aor] ‘поехал’ |
f | женский | й | j | относится только к людям ж.р. цей // ce-j [one-f] ‘одна’ |
n | неодушевленный | б м |
b m |
цеб // ce-b [one-n] ‘одно’ |
iv | четвертый (архаичный) | р | r | има гучӀар заманди // ima gu-ča-r zaman-di [father сop=neg.prs.ptcp-iv time-erg] ‘во время, когда нет отца’ (нынче после смерти отца) |
an.pl | одушевленный во мн.ч. | л н р |
l n r |
рорчӀами // r-orč’ami [an.pl-hello] ‘Здравствуйте!’ |
inan.pl | неодушевленный во мн.ч. | б | b | в корпусе не размечен |
an | одушевленный (в отрицательных причастиях) | лъ | ɬ | игьилъичӀаб // ih-i-ɬ-i-č’a-b [do-is-an-is-neg.prs.ptcp-b] ‘не делающий’ *** |
inan | неодушевленный (в отрицательных причастиях) | х | χ | къварихичӀаб // q’war-i-χ-i-č’a-b [need-is-inan-is-neg.prs.ptcp-n] ‘ненужное’ |
Косвенная основа | ||||
obl | косвенная основа | -а- -у- … |
-a- -u- … |
Появляется в именах между корнем и показателем падежа. Например, гьудулалъи // hudul-a-ɬi [ friend-obl-gen] ‘друга’ |
m.obl | косвенная основа мужского рода | -щу- | -šːu- |
гьущухеку // hu-šːu-χe-ku [dem-m.obl-apud-el] ‘от него’ |
nm.obl | косвенная основа немужского рода | -лълъи- -лъи- |
-ɬːi- -ɬi- |
гьулълъиди // hu-ɬːi-di [dem-nm.obl-erg] ‘это’ |
pl.obl | косвенная основа имен во множественном числе | -да- -лу- |
-da- -lu- |
гьулухеку // hu-lu-χe-ku [dem-pl.obl-apud-el] ‘от этих’, ‘от них’ |
Падеж | ||||
unmarked | начальная форма (имени), абсолютив | Это немаркированная по падежу форма имен; она используется в в функции абсолютива. | ||
erg | эргативный | -ди | -di | Например: адамалуди ‘люди’ (в контексте “люди сожгли лес”); гъеруди ‘ложкой’ (в контексте ‘ложкой месить тесто’); цеб зивди ‘в один день’ (однажды) |
gen | родительный | -лъи | -ɬi | гьудулалъи // hudul-a-ɬi [friend-obl-gen] ‘друга’ |
CM[gen] | родительный | -CM | -CM | Выражен показателем класса; ищиб // išːi-b [we.excl-n[gen]] ‘наше’ |
dat | дательный | -й -ий |
-j -ij |
дий // di-j [I.obl-dat] ‘мне’ |
Местные падежи | ||||
sup | super, локализация на поверхности | -е -у -ди |
-e -u -di |
ахъулу // aqul-u [hearth-sup] ‘на очаге’ |
cont | локализация в контакте с объектом | -чӀу | -č’u | хьагичӀуку // xagi-č’u-ku [pan-cont-el] ‘от кастрюли’ |
apud | локализация рядом с объектом | -хе -хи -хъе -хъи |
-χe -χi -qe -qi |
гьущухеку // hu-šːu-χe-ku [dem-m.obl-apud-el] ‘от него’ |
in | локализация внутри объекта | -лъи -лълъу -лӀи |
-ɬi -ɬːu -ƛi |
рухьулъику // ruxu-ɬi-ku [forest-in-el] ‘из леса’ |
sub | локализация под объектом | -кьи | -ƛʼi | ахикьи // aχi-ƛʼi [garden-sub] ‘в саду’ |
lat | латив, направление к объекту | -а | -a | гьеа // he-a [above-lat] ‘наверх’ |
el | элатив, направление от объекта | -ку -ру |
-ku -ru |
рухьулъику // ruxu-ɬi-ku [forest-in-el] ‘из леса’ |
sup.lat | суперлатив, сочетание локализации “на” с направлением “движение к” | -а | -a | муха // muχ-a [work-sup.lat] ‘на работу’ |
apud.lat | апудлатив, сочетание локализации “у” с направлением “движение к” | -ха -хъа |
-χa -qa |
бекӏун-а-ха // bek’un-a-χa [corner-obl-apud.lat] ‘в угол’ |
in.lat | инлатив, сочетание локализации “внутри” с направлением “движение к” | -лъа -лълъа |
-ɬa -ɬːa |
рухьулъа // ruxu-ɬa [forest-in.lat] ‘в лес’ |
sub.lat | сублатив, сочетание локализации “под” с направлением “движение к” | -кьа | -ƛʼa | дордолакьа //dordol-a-ƛʼa [drain-obl-sub.lat]‘под водосток’ *** |
Наклонение | ||||
imp | императив | -а -ба -и -й |
-á -ba -i -j |
йама // j-a<m>-a [f-go<n>-imp] ‘сходи’ |
juss | юссив | =ла | =la | гов гьивда арагьвабала // go-w hi-w=da araʁʷa-ba=la [dem-m self-m=int come-imp=juss] ‘Пусть он придет сюда.’ *** |
opt | оптатив | -абу -ибе |
-abu -ibe |
мисибе // mis-ibe [find-opt] ‘пусть найдется!’ |
proh | прохибитив | -абасси | -abasːi | бетабасси // b-et-abasːi [n-leave-proh] ‘не оставляй’ |
cond | условное наклонение | -ала | -ala | цӀимдала // c’imd-ala [save-cond] ‘если сбережешь’ |
indef | ирреалис (counterfactual) | =хвала | =χʷala | хъвардухвала // qward-u=χʷala [write-aor=indef] ‘написал бы’; хъварду букӀахвала // qward-u b-uk’-a=χʷala [write-cvb n-be-aor=indef] ‘если бы написал’ *** |
conc | уступительное наклонение (concessive) | -алала | -alala | ваншалала // w-anš-alala [m-tie-conc] ‘хоть привяжи’ (даже если привязать) *** |
Время и финитность | ||||
aor | аорист | -а -ив -у |
-a -iw -u |
миса // mis-a [find-aor] ‘нашёл’; икку // ikː-u [give-aor] ‘взял’ |
hab | хабитуалис | -е | -e | иде // id-e [love-hab] ‘люблю’ |
fut | будущее | -(и)кӀа- -(и)кӀо- |
-(i)kʼa- -(i)k’o- |
игьикӀаб // ih-i-k’a-b [do-is-fut-n] ‘сделаем’ |
inf | инфинитив | -и -й -лъи |
-i -j -ɬi |
кьи // ƛʼ-i [say-inf] ‘сказать’ |
is | инфинитивная основа | -и- -й- |
-i- -j- |
йаихай йикӀа // j-a-i-χa-j j-ik’-a [f-go-is-inan.prs.ptcp-f f-be-aor] ‘ходила’ |
an.prs.ptcp | причастие настоящего времени (одуш.) | -лъа- | -ɬa- | йанхилъай //j-an χ-i-ɬa-j [f-get_pregnant-is-an.prs.ptcp-f] ‘беременная’ *** |
inan.prs.ptcp | причастие настоящего времени (неодуш.) | -ха- -хо- |
-χa- -χo- |
гъихал рукӀа // ʁ-i-χa-l r-uk’-a [come-is-inan.prs.ptcp-an.pl an.pl-be-aor] ‘приходили’ [imperfect] |
an.fut.ptcp | причастие будущего времени (одуш.) | -лъа- | -ɬa- | ида йаъилъай // ida j-aʔ-i-ɬa-j [cop f-go-is-an.fut.ptcp-f] ‘пойду’ |
inan.fut.ptcp | причастие будущего времени (неодуш.) | -ха- -хо- |
-χa- -χo- |
букӀихоб // b-uk’-i-χo-b [n-be-inf-inan.fut.ptcp-n] ‘будущий’ *** |
pst.ptcp | причастие прошедшего времени | -а- | -a- | букӀаб ида // b-uk’-a-b ida [n-be-pst.ptcp-n cop] ‘был’ |
cvb | основное деепричастие (конверб) | -а -ив -у |
-a -iw -u |
хадуда // χad-u=da [ask-cvb=cop[prf]] ‘спросила’ |
prog | прогрессивный конверб | -а -ата -ат |
-a -ata -at |
бижата // b-iž-ata [n-grow-prog] ‘растут’; масатида // mas-at=ida [tell-prog=cop] ‘рассказываю’ |
temp | темпоральный конверб (temporal converb) | -руди -ригьуди -риуди |
-rudi -rihudi -riudi |
булӀаруди // b-uƛ-a-rudi [n-finish-th-temp] ‘закончив’; также не с глаголами: горуди = go-rudi [dem-temp] ‘в то время’, ‘тогда’ |
until | “до тех пор пока не” (лексический глосс) | =дера | =dera | мигьидера // mih-i=dera [boil-inf=until] ‘пока (не) сварится’ |
msd | масдар, отглагольное существительное | -р | -r | мицӀцӀар //mic’ː-a-r [become_tasty-caus-msd] ‘сладость’ |
Валентность глагола | ||||
caus | каузатив | -а- | -a- | бигъайла // b-iʁ-a-j=la [n-mix-caus-inf=add] ‘и перемешиваю’ |
caus.aor | каузативный аорист | -о | -o | идо // id-o [love-caus] ‘понравилось’ |
caus.cvb | каузативный конверб | -о | -o | къваро маси // q’war-o mas-i [need-caus.cvb tell-inf] ‘хочу рассказать’ |
Отрицание | ||||
neg | отрицание | -чӀ- -чӀу … |
-č’- -č’u … |
бегъечӀу // b-eʁ-e-č’u [n-know-hab-neg] ‘не знаю’ |
neg.aor | отрицательный аорист | -чӀа -чӀи |
-č’a -č’i |
букӀичӀама // b-uk’-i-č’a=ma [n-be-is-neg.aor=pq] ‘Не было ли?’, ‘Не так ли?’ |
neg.cvb | отрицательный конверб | -чӀа | -č’a | цӀатайчӀа букӀи // c’at-a-j-č’a b-uk’-i [burn-caus-is-neg.cvb n-be-inf] ‘(чтобы) не обжечь’ |
neg.prog | отрицательный прогрессивный конверб | -чӀада | -č’ada | бегъичӀада // b-eʁ-i-č’ada [n-know-is-neg.prog] ‘не зная’ |
neg.cond | отрицательное условие | -чӀала | -č’ala | мисичӀала // mis-i-č’ala [find-is-neg.cond] ‘если не найти’ |
neg.prs.ptcp | отрицательное причастие настоящего времени | -чӀа- | -č’a- | къварихичӀаб // q’war-i-χ-i-č’a-b [need-is-inan-is-neg.prs.ptcp-n] ‘ненужное’ |
Иллокутивные маркеры Вопросительные частицы | ||||
an.cq | одуш. вопросительная частица (animate content question particle) | =лъи.ла | =ɬi.la | эпилъила // epi=ɬi.la [why=an.cq] ‘Зачем?’ |
an.pq | одуш. полярная вопросительная частица (animate polar question particle) | =лъи.ма | =ɬi.ma | гьинулъимахикӀул // hinu=ɬi.ma=χi=k’ul [inside=an.pq=?=quot] ‘внутри что ли’ (про ослов во дворе) |
cq | вопросительная частица (content question particle) | =ла | =la | эбла // e-b=la [what-n=cq] ‘что’ |
inan.cq | вопросительная частица (inanimate content question marker) | =ху.ла | =χu.la | эбхула // e-b=χu.la [what-n=inan.cq] ‘Что?’ |
inan.pq | вопросительная полярная частица (inanimate polar question marker) | =ху.ма | =χu.ma | батӀебхума // bat’e-b=χu.ma [different-n=inan.pq] ‘Другой что ли?’ |
pq | вопросительная полярная частица (polar question particle) | =ма | =ma | букӀичӀама // b-uk’-ič’a=ma [n-be-neg.aor=pq] ‘Не было ли?’, ‘Не так ли?’ |
Передача чужой речи | ||||
quot | цитатная частица (quotative particle) | =талу =кӀул |
=talu =k’ul |
“Дийла икка, ила, буршималъи!” талу гьикьуда йешилълъиди // di-j=la ikː-a ila burši-maɬi =talu hiƛʼ-u=da ješi-ɬːi-di [I.obl-dat=add give-imp mother pie-pl =quot say-cvb=cop[prf] daughter-nm.obl-erg] ‘Дай мне тоже лепешек, мама! - сказала дочка.’ |
rep | слух (reportative particle) | =хвата | =χʷata | Используется для передачи информации, основанной на слухах (used to indicate that a statement is based on hearsay); дийхвата // di-j=χwata [I.obl-dat=rep] ‘для меня, говорят, …” |
Деривация существительных | ||||
? | словообразовательный суффикс, образующий статусные существительные (status nouns) | -лъи | -ɬi | гьудуллъи // hudul-ɬi [friend-?] ‘дружба’ |
agn | имя деятеля (agent nominalization) | -хъан | -qan | мацӀцӀихъан // mac’ː-i-qan [ask-is-agn] ‘сплетник, ябеда’ *** |
? | в сочетании с суффиксом множественного числа используется для образования фамилий (collective family names) | -ххан | -χːan | Мирзаххандул // Mirza-χːan-dul [Mirza-?-pl] ‘Мирзаевы/ семья (род) Мирзы’ *** |
Деривация прилагательных и наречий | ||||
comp | сравнительная частица | =гъу | =ʁu | анзигъу // anzi=ʁu [snow=comp] ‘как снег’ *** |
simil | симилатив (подобие) | =ццу- -ерхи |
=cːu- -erχi |
вацциццув // w-acːi=cːu-w [m-sibling=simil-m] ‘как брат’ |
eq | экватив (equative) | =гъвана | =ʁʷana | кавугъвана // kawu=ʁʷana [gate=eq] ‘как ворота’ *** |
atr | атрибутивная частица | =кӀо =ссу- |
=k’o =sːu- |
гьатакӀоруди // h-ata=k’o-rudi [do-prog=atr-temp] ‘когда работает’; Буйхессуб // Bujχe-sːu-b [Botlikh[toponym]=atr-n] ‘ботлихский(-ая)’ |
an.atr | атрибутивная частица (одуш.) | =лъа- | =ɬa- | used to attributivize progressive converbs and a handful of other constituents; гьингъалъал // hi<n>ʁ-a=ɬa-l [come<an.pl>-prog.cvb=an.atr-an.pl] ‘приехавшие’ |
inan.atr | атрибутивная частица (неодуш.) | =хо- | =χo- | used to attributivize progressive converbs and a handful of other constituents; игьатахоб // ih-ata=χo-b [do-prog=inan.atr-n] ‘готовящийся’ |
restr | ограничительная частица (restrictive particle) | =гъа- =гъо- |
=ʁa- =ʁo- |
гоцегъов // go-ce-ʁo-w [dem-one=restr-m] ‘(из какой-то группы) вот этот вот (конкретный)’ |
adv | адвербиализатор (adverbializer) | -а -лъа -о |
-a -ɬːa -o - |
гванзо // gʷanz-o [good-adv] ‘хорошо’ |
Деривация числительных | ||||
num | числительное | -да | -da | кӀеда // k’eda [two-num] ‘два’ |
lnk | связывающий элемент числительных (numeral linking morpheme) | -лъи -чӀуекӀу |
-ɬi -čʼukʼu |
гьацӀлъи гьакьуда // hac’-ɬi haƛʼu-da [ten-lnk seven-num] ‘семнадцать’ |
an.ord | одуш. порядковое (animate ordinal) | -лъа- | -ɬa- | кӀейилъаб зини //k’e-ji-ɬa-b [two-th-an.ord-n] ‘вторая корова’ *** |
inan.ord | неодуш. порядковое (inanimate ordinal) | -хо- | -χo- | гьакьуйхоб // haƛʼu-j-χo-b [seven-th-inan.ord-n] ‘седьмой’ |
fract | дробное fractional numeral | -ркьа | -rƛʼa | кӀеркьа // k’e-rƛʼa [two-fract] ‘надвое, на две (части)’ *** |
mult | мультипликативное (multiplicative numeral) | -цӀи -рцӀи |
-c’i -rc’i |
гьабцӀи // hab-c’i (‘трижды’) *** |
ten | “десять” (лексический глосс) | -цӀали- | -cʼali- | Образует числительные от 20 до 90. бикьицӀалида // biƛʼi-c’ali-da [eight-ten-num] ‘80’ *** |
ten.lnk | сочетание суффикса “десять” со связующим элементом | -цӀай | -c’aj | Сочетание суффиксов -c’ali-ɬi (-ten-lnk) иногда сокращается до -c’aj. |
Глагольная деривация | ||||
vbz | показатель вербализации (verbalizer) | -д -ела -кӀва -ку -са -хху -лъ- |
-d -ela -k’ʷa -ku -sa -χːu -ɬ- |
хӀайди // ħaj-d-i [hup-vbz-inf] ‘нокать, погонять’ (т.е. подгонять ослов, лошадей, от междометия хӀай ‘Но!’) |
Тематические маркеры | ||||
th | тематический элемент (thematic element) | -а- -й- |
-a- -j- |
булӀаруди // b-uƛ-a-rudi [n-finish-th-temp] ‘закончив’; гьакьуйхоб // haƛʼu-j-χo-b [seven-th-inan.ord-n] ‘седьмой’ |
Другие частицы и клитики | ||||
add | аддитивная частица | =ла | =la | денла // den=la [I=add] ‘я тоже’ |
comit | комитатив | =лълъи | =ɬːi | лълъенилълъи // ɬːeni=ɬːi [water=comit] ‘с водой’ |
aux | вспомогательный глагол | =мал- =малигь- |
=mal- =malih- |
гьибцӀамале // hibc’-a=mal-e [fill-caus(inf)=aux-hab] ‘наполняю’ (сокращенное от “гьибцӀай мале”) |
even | ‘даже’ (лексический глосс) | =дала | =dala | миндала // min=dala [you.sg=even] ‘ты же’ |
func | “в качестве …” (functive) | =лъун | =ɬun | обозначает роль субъекта; мугӀалим=лъун // muʕalim=ɬun [teacher=func] ‘в качестве учителя’ *** |
indef | неопределенное (indefinite particle) | =хвала =гӀала =кӀвала |
=χʷala =ʕalla =kʼʷala |
инндакӀвала // inda=kʼʷala [when=indef] ‘никогда’ |
int | усилительная частица (intensifying particle) | =да | =da | дуйда // du-j=da [you.sg.obl-dat=int] ‘тебе же’ |
ptc | усилительная частица (emphatic particle) | =хха =ха |
=χːa =χa |
переводится русской усилительной частицей же; бухичӀамахха // buχ-i-č’a=ma=χːa [take-is-neg.aor=pq=?] ‘разве же не забрали?; рукӀеха // r-uk’-e=χa [an.pl-be-hab=ptc] ‘живем же’ |
cop | связка, копула | =да =ида |
=da =ida |
масатида // mas-at=ida [tell-prog=cop] ‘рассказываю’ (сокращенное от “масата ида”); инчуда // inču=da [apple=cop] ‘яблоня есть’ (сокращенное от “инчу ида”) |
towards | ‘по направлению к’ (лексический глосс) | =ду =ххинду |
=du =χːindu |
рухьулъаххинду // ruxu-ɬa=χːindu [mountain-in.lat=towards] ‘в сторону горы’ *** |
? | все непонятное |
*** примеров данных явлений в корпусе пока нет, поэтому примеры взяты из других источников
Примечание. Для времени “perfect”, образуемым VERB-cvb=cop (сокращенно произносимым носителями VERB=cop с ударением на корень) и времени “intentional future”, образуемым VERB-is=cop(сокращенно произносимым носителями также VERB=cop, но с ударением на “и” в “ида”), было решено ввести особые глоссы: VERB-cvb=cop[prf] (в сокращенном варианте VERB=cop[prf]), см. пример (1) и VERB-is=cop[fut] (в сокращенном варианте VERB=cop[fut]), см. пример (2), следуя логике принятого для ботлихского языка способа глоссирования родительного падежа маркируемого маркером класса (-CM[gen]).
(1) | Цеб зивди илуди хадуда гьулълъихи: | ||||
---|---|---|---|---|---|
це-б | зив-ди | ил-у-ди | хад-у=да | гьу-лълъи-хи | |
ce-b | ziw-di | il-u-di | χad-u=da | hu-ɬːi-χi | |
one-n | day-erg | mother-obl-erg | ask-cvb=cop[prf] | dem-nm.obl-apud | |
“В один день мать попросила ее:” |
(2) | Мигьидера бетида. | |
---|---|---|
мигь-и=дера | б-ет=ида | |
mih-i=dera | b-et=ida | |
boil-inf=until | n-leave=cop[fut] | |
“Оставим пока сварится.” |
Личные местоимения имеют лексические глоссы
Условное обозначение | Запись кириллицей | Запись латиницей | Комментарии |
---|---|---|---|
I | ден | den | |
I.erg | ишкур | iškur | |
I.obl | ди- | di- | |
I.obl.dat | ди | di | сокращенное от ди-й // di-j [I.obl-dat] |
we.incl | илӀи | iƛi | |
we.excl | ищи | išːi | |
you.sg | мин | min | |
you.sg.obl | ду- | du- | |
you.sg.obl.dat | ду | du | сокращенное от ду-й // du-j [you.sg.obl-dat] |
you.pl | бишти | bišti |
Поиск по глоссам позволяет создавать запросы, касающиеся морфемной структуры словоформ.
1. Общие принципы работы поиска по глоссам приводятся в разделе «Справка» (кнопка с вопросительным знаком в правом верхнем углу страницы поиска).
2. При поиске по глоссам не находятся такие словоформы, при глоссировании которых релевантные части словоформ не членятся на морфемы. Например, словоформа эргативного падежа местоимения ден ‘я’ выглядит как ишкур, не членится на морфемы и глоссируется целиком как I.erg. Эта словоформа попадает в выдачу по грамматическому запросу «erg», но при поиске по глоссам она не попадает в выдачу по запросу «STEM-ERG». При этом, если в поиске по глоссам запросить конкретныую форму, например, «I.erg», то в результат попадут все такие примеры.
3. Для поиска “всего непонятного”, глоссированного вопросительным знаком “?”, в поиске по глоссам необходимо вводить не “?”, а “??” или “\?”.
4. Поскольку tsakorpus не поддерживает квадратные и угловые скобки, при глоссировании интерфиксов (например, и<б>х-и //i<b>χ-i [take<n>-inf] ‘взять’), родительного падежа, выраженного классными показателями (например, ищиб // išːi-b [we.excl-n[gen]] ‘наше’), и т.п. были использованы круглые скобки. Таким образом, глоссы для словоформ “взять” и “наше” в Корпусе выглядят так: take(n)-inf и we.excl-n(gen).
5. Поиск глоссов, содержащих скобки, например, интерфиксов, на данный момент затруднен по техническим причинам. Так, например, при поиск примеров использования показателя класса, глоссируемого “n”, при запросе “n” по полю “Глосс” Корпус выдаёт употребления с интерфиксами, однако, примеры с классовым родительным падежом, например we.incl-n(gen), Корпус не выдает. Для поиска таких примеров запрос необходимо экранировать:
Для поиска примеров с “cop(fut)” в поиск по “Глоссам” вбивать следует “cop\(fut\)”.
При помощи этого поля возможен поиск словоформ в соответствии с английским переводом соответствующих лемм. Например, по запросу «do» в поле «Перевод (eng)» выдаются все употребления глагола игьи, корень которого глоссируется в корпусе как «do». Поиск по переводу не позволяет искать русские или английские словоформы, использованные в переводах ботлихских предложений. Например, при помощи этой функции нельзя найти все предложения, в переводах которых используется словоформа «сделали». Чтобы найти такие предложения, необходимо воспользоваться полнотекстовым поиском.
Каждой словоформе в корпусе, за исключением имён собственных, добавлена пометка “language”, отражающая язык (или язык-источник) или всей словоформы или ее составляющих. Так, словоформу специябалъила // specija-baɬi=la [spice(RUS)-pl=add] ‘и специи’ можно найти по пометам “Russian, Botlikh”, “Russian” или “Botlikh” в графе “язык (language)”.
Поиск возможен по тегам Botlikh, Russian, Avar, Arabic.
Общие сведения. В корпусе содержится 12 текстов общей продолжительностью чуть более 20 минут, объем корпуса чуть более 1500 слов.
Социолингвистические характеристики. Тексты корпуса были записаны от 12 носителей разных поколений, от 1957 до 2010 г.р.
Распределение текстов по годам рождения носителей и количеству слов по жанрам текстов показано в графике ниже.
Распределение текстов по годам рождения носителей показано в таблице.
Год рождения | Количество носителей | Продолжительность текстов (в секундах) |
1957–1960 | 1 | 260 |
1961-1970 | 6 | 708 |
1971–1980 | 2 | 163 |
1981–1990 | 1 | 6 |
1991–2000 | 0 | 0 |
2001–2010 | 2 | 178 |
Жанровый состав. В основном в корпус входят полуспонтанные монологические тексты, есть один вотсап диалог. В таблице ниже отражен жанрово-тематический состав текстов в секундах записей.
Жанр | Количество текстов | Продолжительность текстов в секундах |
---|---|---|
Рецепты | 3 | 229 |
(Авто)биографии | 1 | 102 |
Истории из жизни | 2 | 151 |
Легенды и сказки | 2 | 120 |
Пословицы | 1 | 260 |
Описания | 2 | 275 |
Диалоги | 1 | 170 |
Тексты, вошедшие в корпус, были записаны и расшифрованы в 2022–2023 гг. Международной лабораторией языковой конвергенции Высшей Школы Экономики (НИУ ВШЭ).
В работе над корпусом участвовали Самира Верхеес, Сара Задыкян и Кьяра Наккарато.
Помощь в расшифровке текстов на ботлихском языке оказали жители с. Ботлих, прежде всего Алиева Х.А., Кадырова М.А., Мажидова С.М.. С расшифровкой аварских включений также помогала Газимагомедова П. Б.
По содержательным вопросам:
Сара Задыкян: zadykian@gmail.com
По техническим вопросам:
Илья Садаков: saltymon@gmail.com
Если Вы используете данные Корпуса в своём исследовании, воспользуйтесь следующей
ссылкой: