EN  |  RU  | 

Устный корпус МАЛОКАРАЧКИНСКОГО говора чувашского языка



Корпус содержит устные тексты на малокарачкинскогом говоре чувашского языка, которые были записаны в 2011–2023 гг. в с. Малое Карачкино Ядринского р-на Чувашской республики. Тексты до 2017-го года были записаны В. М. Филипповой и А. В. Дыбо. Остальные тексты записывались участниками коллективных студенческих экспедиций под руководством М. А. Холодиловой. Малокарачкинские тексты, предоставленные в корпусе, значительно отличаются от текстов на литературном чувашском языке; основные отличия малокарачкинского говора от литературного языка на уровне морфонологии описаны в разделах ниже. Эти особенности необходимо учитывать при работе с корпусом.


К поиску

Рис. 1. Чувашская Республика на карте РФ Рис. 2. Ядринский район на карте Чувашской республики

Транскрипция

Тексты устного корпуса малокарачкинского говора записаны расширенной латиницей. Обозначения фонем выбраны в соответствии с Международным Фонетическим Алфавитом. Принятая в этом проекте система латинической записи на основе МФА отражена в Таблице 1 и Таблице 2. Таблицы составлены Максимом Леонидовичем Федотовым.

Таблица 1. Система гласных малокарачкинского говора

Передний ряд Средний ряд Задний ряд
Неогубленные Огубленные
Верхний подъем i y ɨ u
Средний подъем e, ë ø ə o
Нижний подъем a

Таблица 2. Система согласных малокарачкинского говора

Губные Зубные/Альвеолярные Ретрофлексные (Альвео-)палатальные Велярные
Непалатализованные Палатализованные
Взрывные p    b t    d tʲ    dʲ k g
Фрикативные s    z ʂ    ʐ ɕ    ʑ x
Аффрикаты ʨ    ʥ
Носовые m n
Аппроксиманты v l j
Дрожащие r

В отличие от традиционной орфографии, в применяемой в корпусе системе транскрипции последовательно отражается звонкость согласных в позиции между гласными и между сонорным и гласным. В ряде случаев озвончение происходит на стыке слов, в этом случае оно также отражается в транскрипции. Фрагменты записанных текстов, в которых произносятся русские слова без каких-либо признаков фонетической или грамматической адаптации, трактовались как случаи переключения кода. Такие фрагменты записаны в корпусе кириллицей.


Особенности малокарачкинского говора

Для корректной работы с корпусом необходимо учитывать, что малокарачкинский говор обладает рядом отличий от литературного языка, которые последовательно отражены в корпусе. В разделах ниже описываются основные фонологические и морфологические особенности малокарачкинского говора в том варианте, в котором он представлен в корпусе [Ашмарин 1898: 344–392]. В речи современных носителей, в частности в представленном корпусе, встречаются отклонения от этих особенностей.

Вид на Пионерскую улицу. Автор: Наталья Логвинова

Фонетика, фонология и морфонология

Фонетико-фонологическая система малокарачкинского говора отличается от литературного чувашского в следующих аспектах.


Гласные:
  • наличие огубленного переднерядного среднего подъёма /ø/, выступающего в большинстве случаев на месте литературного /y/ (ср. лит. pyrt <пӳрт> ‘дом’ — мал.-к. pørt ‘дом’), а также в некоторых других случаях;
  • оканье (ср. лит. uram <урам> ‘улица’ — мал.-к. oram ‘улица’);
  • более регулярная, чем в литературном языке, сингармония гласных по ряду, в частности, сингармонируют следующие показатели:
    • показатель множественного числа -sаm/-sem,
    • показатель посессивности третьего лица -ə/ё,
    • копула прошедшего времени и показатель ретроспективного сдвига -ʨə/-ʨё,
    • личные окончания настоящего времени 3PL (-aʨə/-eʨё), прошедшего времени 3SG (-ə/-ё) и 3PL (-əɕ/-ёɕ) и будущего времени 3SG (‑ə/‑ё);
  • в отличие от литературного языка, не сингармонируют:
    • посессивный показатель второго лица (-u(n), -ə(n), -n),
    • показатель номинализации -u.

Согласные:
  • сокращение части геминированных шумных и /l/ (ср. лит. kaʨʨə <каччă> ‘парень’ — мал.-к. kaʨə ‘парень’, но tëttëm ‘темно’ и ср. лит. vaskamalla <васкамалла> ‘нужно спешить’ — мал.-к. vaskamala ‘нужно спешить’);
  • фонологизованные звонкие шумные согласные (ср. sokər ‘слепой’ (лит. sukkər <суккăр>) — sogər ‘смола’);
  • /k/ вместо /х/ на конце слога (ср. лит. pəx <пăх> ‘смотри’ — мал.-к. pək ‘смотри’);
  • сочетанию /j/ с согласным в литературном часто соответствует палатализация согласного в малакарачкинском (ср. лит. kajran <кайран> ‘позади’ — мал.-к. karʲan ‘позади’);

Как пользоваться корпусом

В этом разделе описываются инструкции по поиску в Устном корпусе малокарачкинского говора чувашского языка (далее Корпус). Этот Корпус относится к группе корпусов, использующих поисковую платформу tsakorpus. Инструкция с описанием общих технических возможностей поиска в корпусах этого типа содержится в разделе «Справка» (кнопка с вопросительным знаком в правом верхнем углу страницы поиска). Здесь же описываются правила, специфические для данного Корпуса.

На основной странице поиска появляется форма с полями «Слово», «Корень», «Грамматика» и «Глоссы».


Основные возможности поиска


Поиск точных форм («Слово»)

В этом поле можно ввести словоформы, вхождения которых вы хотите найти. Следует помнить, что чувашские тексты записаны в корпусе в транслитерации. Например, для поиска всех вхождений формы местного падежа килте ‘в доме’ существительного кил ‘дом’ нужно задать в поле «Слово» словоформу kilde.


Поиск корней («Корень»)

Это поле следует использовать для поиска всех форм одного слова (лексемы, леммы). Например, если в это поле вбить слово ëɕ, то в поисковой выдаче окажутся все вхождения этого существительного во всех его формах, например, ëʑe [ëʑ-e, работа-OBJ] ‘работу’, ëɕren [ëɕ-ren, работа-ABL] ‘с работы’, ëɕne [ëɕ-n-e, работа-P_3-OBJ] ‘его работу’ и т.д.

При поиске необходимо учитывать фонетико-фонологические особенности малокарачкинского говора. Так, для того, чтобы найти все формы существительного oram ‘улица’ в поле поиска нужно вписать именно эту форму, а не литературное uram ‘улица’. При поиске по корням учитываются также формы с факультативным озвончением. Так, при поиске по корню kil ‘дом’, в выдачу попадут как формы без начального озвончения (kile ‘домой’), так и с начальным озвончением (gile ‘домой’).

В Корпусе не проводится различие между словоизменением и словообразованием. В частности, формы, построенные по регулярным словообразовательным моделям, воспринимаются Корпусом как формы производящих корней. Например, глагол, который в словарях трактуется как лексема ɕider ‘кормить’, для Корпуса является формой каузатива от глагола ɕi ‘есть’. Как следствие, по запросу ɕider в поле «Корень» Корпус не выдаст результатов, а по запросу ɕi будут показаны как формы без показателя каузатива (например, ɕepërʨё ‘мы ели’), так и формы с показателем каузатива (например, ɕiderdëm ‘я накормил’ и т.д.). Чтобы получить только каузативные формы, можно сузить запрос, воспользовавшись полями «Грамматика» или «Глоссы». Аналогичные решения приняты и для многих других словообразовательных процессов (см. раздел «Грамматика»).


Грамматика

Поле «Грамматика» позволяет осуществлять поиск по частям речи и грамматическим категориям. Для того, чтобы воспользоваться этим поиском, необходимо нажать на кнопку в правой части поля «Грамматика» — появится окно-подсказка, в котором можно выбрать необходимые грамматические пометы. Пользователи, знакомые с разметкой настоящего корпуса, могут вписывать грамматические теги в поисковые поля, используя ограниченный набор регулярных выражений. Для более детальной информации следует использовать раздел “Справка” (кнопка с вопросительным знаком в правом верхнем углу страницы поиска).

Система грамматических признаков, используемых в Корпусе, представлена в таблицах ниже.


1. Имя

1.1. Существительное и местоимения
Помета Значение Показатель Регулярные варианты
Число
pl множественное число -sam, -sem -zam, -zem
-san, -sen
-zan, -zen
-sanʲ, -senʲ
-zanʲ, -zenʲ
Падеж
gen родительный падеж -(ə)n, -(ё)n
obj объектный падеж -a, -e -ja, -je
loc локатив -ra, -re -da, -de
-ʥa, -ʥe
abl аблатив -ran, -ren -dan, -den
-ʥan, -ʥen
ins инструменталис -pa, -pe
-pala, -pele
-ba, -be
-bala, -bele
car каритив -sər, -sёr -zər, -zёr
csl каузалис -ʂən, -ʂёn -ʐən, -ʐёn
prop проприетив -lə, -lё
dest дестинатив -lək, -lёk
sml симилятив -aʂkal, -eʂkel
dir директив -la, -le
Посессивные показатели
p_1 посессор 1л. ед.ч. -(ə)m, -(ё)m
p_1pl посессор 1л. мн.ч. -(ə)mər, -(ё)mёr
p_2 посессор 2л. ед.ч. -u(n) -n
p_2pl посессор 2л. мн.ч. -ər, -ёr
p_3 посессор 3л. -(ʲ)ə(n), -(ʲ)ё(n)
-i(n)
-ʂë
-jə(n), -jё(n)
-nʲ
-ʐё

1.2. Местоимения
Помета Значение Показатель Регулярные варианты
indef неопределенность tа-, te-
приименное отрицание ni-

1.3. Прилагательные
Помета Значение Показатель Регулярные варианты
subst субстантивация -sker
cmpr компаратив -rak, -rek
-tarak, -terek

1.4. Числительные
Помета Значение Показатель Регулярные варианты
ord порядковое числительное -məʂ, -mёʂ
col.p_1pl собирательное числительное -səmər, -sёmёr
col.p_2pl -sər, -sёr
col.P_3 -əʐə, -ёʐë
-(ə)ʂ
distr дистрибутив -ʂar, -ʂer

2. Глагол

2.1. Финитные формы: наклонения и времена
Помета Значение Показатель Регулярные варианты
npst непрошедшее время -a, -e
-at, -et
pst прошедшее время -r -rʲ, -t, -ʨ
cop_pst копула прошедшего времени =ʨə, =ʨё
plup плюсквамперфект -satt, -sett
ipf имперфект -(a)tt, -(e)tt
-(a)tʨ, -(e)tʨ,
fut будущее время -ə, -ё
-(ʲ)ə, -(ʲ)ё
imp.2sg императив
imp.2pl -ər, -ёr
juss.3sg юссив -tər, -tёr
juss.3pl -ʨər, -ʨёr
-ʨʨər, -ʨʨёr
sbjv сослагательное наклонение -(ə)tt, -(ё)tt

2.2. Финитные формы: согласовательные показатели
npst fut pst hort/imp/juss
1sg -p, -əp, -ёp -əm, -ёm -am, -em
1pl ‑pər, -pёr -əmər, -ёmёr -ar, -er
2sg -n, -ən -ən
2pl -ər, -ёr -r -ər, -ёr
3sg -at, -et
npst.3sg
‑(ʲ)ə, -(ʲ)ё
fut.3sg
-ə, -ё ‑tər, ‑tёr
3pl ‑aʨə, -eʨё
npst.3pl
-əɕ, -ёɕ -ʨər, -ʨёr

2.3. Нефинитные формы
Помета Значение Показатель Регулярные варианты
inf инфинитив -ma, -me
inf2 -maʂkən, -meʂkёn
inf-attr -ma-la, -me-le
inf-dest ‑ma-lək, -ma-lёk
pc_prs причастие настоящего времени -agan, -egen
pc_res результативное причастие -an, -en
pc_pst причастие прошедшего времени -nə, -nё
pc_fut причастие будущего времени -as, -es
pc_pot потенциальное причастие -i
cv_att аттенуативное деепричастие -a, -e
cv_sim деепричастие одновременности -sa, -se
cv_post постериорное деепричастие -iʨen
cv_ant антериорное деепричастие -san, -sassən
-sen, -sessёn

2.4. Глагольная деривация
Помета Значение Показатель Регулярные варианты
pot потенциалис ‑il, ‑i
refl рефлексив ‑ən,-ёn
‑əl,-ёl
caus каузатив -tar, -ter
att аттенуатив -kala, -kele

3. Словообразование и под.
Помета Значение Показатель Регулярные варианты
vbz вербализатор -la, -le
attr атрибутив -la, le
attr_temp темпоральный атрибутив -xi

4. Частицы и т.п.
Помета Значение Показатель Регулярные варианты
emph эмфаза -ak, -ek
add аддитивная частица =ta, =te
q вопросительная частица =i, =j
q2 вопросительная частица =ʂɨ
‘ведь’ =(ə)ɕ, =(ё)ɕ
cond кондиционал =tək, =tёk
ncat некатегоричность =xa, =aj, =ej
‘оказывается’ iken
‘вроде’ ende

Глоссы

Поиск по глоссам позволяет создавать запросы, касающиеся морфемной структуры словоформ. Поиск по глоссам очень похож на поиск по грамматике, однако позволяет задавать более сложные запросы. В частности, задавать порядок следования граммем и искать формы, содержащие более одного вхождения данной граммемы.

Общие принципы работы поиска по глоссам и основные отличия такого поиска от поиска по грамматике приводятся в разделе «Справка».


Перевод

При помощи этих полей возможен поиск словоформ в соответствии с русским / английским переводом соответствующих лемм. Например, по запросу «давать» в поле «Перевод (ru)» выдаются все употребления глагола par, корень которого глоссируется в корпусе как «давать». Поиск по переводу не позволяет искать русские или английские словоформы, использованные в переводах чувашских предложений. Например, при помощи этой функции нельзя найти все предложения, в переводах которых используется словоформа «дали». Чтобы найти такие предложения, необходимо воспользоваться полнотекстовым поиском.


Дополнительные возможности поиска

Параметры поиска, связанные с говорящим, с которым записан текст, устроены по принципу выпадающих окон, в которых перечислены все встретившиеся в Корпусе значения параметров. Например, в поле «Место рождения» перечислены все места, в которых родились те говорящие, с которыми записаны тексты Корпуса.

Все остальные параметры поиска (полнотекстовый поиск, поиск предложений / слов / корней, выбор подкорпуса, одновременное использование нескольких полей, использование поиска по нескольким словоформам и т.д.) не имеют особенностей, характерных только для чувашского Корпуса.



Создатели

Тексты до 2017 года были записаны В. М. Филипповой при поддержке А. В. Дыбо. Значительная часть текстов, вошедших в корпус, были записаны и расшифрованы в 2017–2023 гг. отдельными жителями с. Малое Карачкино и участниками экспедиций, организованными М. А. Холодиловой при административной и финансовой поддержке НИУ ВШЭ. Особый вклад в пополнение и обработку текстов внесли жительницы с. Малое Карачкино Вероника Михайловна Филиппова – заведующая Малокарчкинской сельской библиотекой, - и Светлана Ивановна Тобоева – учитель чувашского языка и литературы МБОУ "Малокарачкинская ООШ".

Также в записи и расшифровке текстов принимали участие Кира Александровна Байда, Влада Вячеславовна Баранова, Дмитрий Валентинович Герасимов, Айгуль Наилевна Закирова, Агата Александровна Зорина, Елизавета Александровна Романова, Елизавета Андреевна Рыжкова, Дарья Александровна Сапарова, Наталья Константиновна Тарасова, Максим Леонидович Федотов.

В переводе текстов на английский язык помогали Анна Константиновна Луценко и Анастасия Алексеевна Саунина.

Устный корпус малокарачкинского говора чувашского языка поддерживается Международной лабораторией языковой конвергенции Высшей Школы Экономики.

Благодарности

Авторы корпуса благодарят жителей с. Малое Карачкино за многолетнее гостеприимство и помощь. Без невероятной заботы и терпения, проявленных жителями Малого Карачкина, этот корпус никогда не был бы опубликован.


Контакты

По содержательным вопросам:
Наталья Логвинова: natalielo009@gmail.com

По техническим вопросам:
Илья Садаков: saltymon@gmail.com


Как процитировать корпус

Если Вы используете данные Корпуса в своём исследовании, воспользуйтесь следующей ссылкой:

Н. Н. Логвинова, В. М. Филиппова, И. Д. Садаков, М. А. Холодилова. Устный корпус Малокарачкинского говора чувашского языка. 2024. М.: Международная лаборатория языковой конвергенции, НИУ ВШЭ. .