Корпус содержит устные тексты на малокарачкинскогом говоре чувашского языка, которые были записаны в 2011–2023 гг. в с. Малое Карачкино Ядринского р-на Чувашской республики. Тексты до 2017-го года были записаны В. М. Филипповой и А. В. Дыбо. Остальные тексты записывались участниками коллективных студенческих экспедиций под руководством М. А. Холодиловой. Малокарачкинские тексты, предоставленные в корпусе, значительно отличаются от текстов на литературном чувашском языке; основные отличия малокарачкинского говора от литературного языка на уровне морфонологии описаны в разделах ниже. Эти особенности необходимо учитывать при работе с корпусом.
![]() |
![]() |
|
Рис. 1. Чувашская Республика на карте РФ | Рис. 2. Ядринский район на карте Чувашской республики |
Тексты устного корпуса малокарачкинского говора записаны расширенной латиницей. Обозначения фонем выбраны в соответствии с Международным Фонетическим Алфавитом. Принятая в этом проекте система латинической записи на основе МФА отражена в Таблице 1 и Таблице 2. Таблицы составлены Максимом Леонидовичем Федотовым.
Таблица 1. Система гласных малокарачкинского говора
Передний ряд | Средний ряд | Задний ряд | ||
Неогубленные | Огубленные | |||
Верхний подъем | i | y | ɨ | u |
Средний подъем | e, ë | ø | ə | o |
Нижний подъем | a |
Таблица 2. Система согласных малокарачкинского говора
Губные | Зубные/Альвеолярные | Ретрофлексные | (Альвео-)палатальные | Велярные | |||
Непалатализованные | Палатализованные | ||||||
Взрывные | p b | t d | tʲ dʲ | k | g | ||
Фрикативные | s z | ʂ ʐ | ɕ ʑ | x | |||
Аффрикаты | ʨ ʥ | ||||||
Носовые | m | n | nʲ | ||||
Аппроксиманты | v | l | lʲ | j | |||
Дрожащие | r | rʲ |
В отличие от традиционной орфографии, в применяемой в корпусе системе транскрипции последовательно отражается звонкость согласных в позиции между гласными и между сонорным и гласным. В ряде случаев озвончение происходит на стыке слов, в этом случае оно также отражается в транскрипции. Фрагменты записанных текстов, в которых произносятся русские слова без каких-либо признаков фонетической или грамматической адаптации, трактовались как случаи переключения кода. Такие фрагменты записаны в корпусе кириллицей.
Для корректной работы с корпусом необходимо учитывать, что малокарачкинский говор обладает рядом отличий от литературного языка, которые последовательно отражены в корпусе. В разделах ниже описываются основные фонологические и морфологические особенности малокарачкинского говора в том варианте, в котором он представлен в корпусе [Ашмарин 1898: 344–392]. В речи современных носителей, в частности в представленном корпусе, встречаются отклонения от этих особенностей.
![]() |
Вид на Пионерскую улицу. Автор: Наталья Логвинова |
Фонетико-фонологическая система малокарачкинского говора отличается от литературного чувашского в следующих аспектах.
В этом разделе описываются инструкции по поиску в Устном корпусе малокарачкинского говора чувашского языка (далее Корпус). Этот Корпус относится к группе корпусов, использующих поисковую платформу tsakorpus. Инструкция с описанием общих технических возможностей поиска в корпусах этого типа содержится в разделе «Справка» (кнопка с вопросительным знаком в правом верхнем углу страницы поиска). Здесь же описываются правила, специфические для данного Корпуса.
На основной странице поиска появляется форма с полями «Слово», «Корень», «Грамматика» и «Глоссы».
В этом поле можно ввести словоформы, вхождения которых вы хотите найти. Следует помнить, что чувашские тексты записаны в корпусе в транслитерации. Например, для поиска всех вхождений формы местного падежа килте ‘в доме’ существительного кил ‘дом’ нужно задать в поле «Слово» словоформу kilde.
Это поле следует использовать для поиска всех форм одного слова (лексемы, леммы). Например, если в это поле вбить слово ëɕ, то в поисковой выдаче окажутся все вхождения этого существительного во всех его формах, например, ëʑe [ëʑ-e, работа-OBJ] ‘работу’, ëɕren [ëɕ-ren, работа-ABL] ‘с работы’, ëɕne [ëɕ-n-e, работа-P_3-OBJ] ‘его работу’ и т.д.
При поиске необходимо учитывать фонетико-фонологические особенности малокарачкинского говора. Так, для того, чтобы найти все формы существительного oram ‘улица’ в поле поиска нужно вписать именно эту форму, а не литературное uram ‘улица’. При поиске по корням учитываются также формы с факультативным озвончением. Так, при поиске по корню kil ‘дом’, в выдачу попадут как формы без начального озвончения (kile ‘домой’), так и с начальным озвончением (gile ‘домой’).
В Корпусе не проводится различие между словоизменением и словообразованием. В частности, формы, построенные по регулярным словообразовательным моделям, воспринимаются Корпусом как формы производящих корней. Например, глагол, который в словарях трактуется как лексема ɕider ‘кормить’, для Корпуса является формой каузатива от глагола ɕi ‘есть’. Как следствие, по запросу ɕider в поле «Корень» Корпус не выдаст результатов, а по запросу ɕi будут показаны как формы без показателя каузатива (например, ɕepërʨё ‘мы ели’), так и формы с показателем каузатива (например, ɕiderdëm ‘я накормил’ и т.д.). Чтобы получить только каузативные формы, можно сузить запрос, воспользовавшись полями «Грамматика» или «Глоссы». Аналогичные решения приняты и для многих других словообразовательных процессов (см. раздел «Грамматика»).
Поле «Грамматика» позволяет осуществлять поиск по частям речи и грамматическим категориям. Для того, чтобы воспользоваться этим поиском, необходимо нажать на кнопку в правой части поля «Грамматика» — появится окно-подсказка, в котором можно выбрать необходимые грамматические пометы. Пользователи, знакомые с разметкой настоящего корпуса, могут вписывать грамматические теги в поисковые поля, используя ограниченный набор регулярных выражений. Для более детальной информации следует использовать раздел “Справка” (кнопка с вопросительным знаком в правом верхнем углу страницы поиска).
Система грамматических признаков, используемых в Корпусе, представлена в таблицах ниже.
Помета | Значение | Показатель | Регулярные варианты |
Число | |||
pl | множественное число | -sam, -sem | -zam, -zem -san, -sen -zan, -zen -sanʲ, -senʲ -zanʲ, -zenʲ |
Падеж | |||
gen | родительный падеж | -(ə)n, -(ё)n | |
obj | объектный падеж | -a, -e | -ja, -je |
loc | локатив | -ra, -re | -da, -de -ʥa, -ʥe |
abl | аблатив | -ran, -ren | -dan, -den -ʥan, -ʥen |
ins | инструменталис | -pa, -pe -pala, -pele |
-ba, -be -bala, -bele |
car | каритив | -sər, -sёr | -zər, -zёr |
csl | каузалис | -ʂən, -ʂёn | -ʐən, -ʐёn |
prop | проприетив | -lə, -lё | |
dest | дестинатив | -lək, -lёk | |
sml | симилятив | -aʂkal, -eʂkel | |
dir | директив | -la, -le | |
Посессивные показатели | |||
p_1 | посессор 1л. ед.ч. | -(ə)m, -(ё)m | |
p_1pl | посессор 1л. мн.ч. | -(ə)mər, -(ё)mёr | |
p_2 | посессор 2л. ед.ч. | -u(n) | -n |
p_2pl | посессор 2л. мн.ч. | -ər, -ёr | |
p_3 | посессор 3л. | -(ʲ)ə(n), -(ʲ)ё(n) -i(n) -ʂë |
-jə(n), -jё(n) -nʲ -ʐё |
Помета | Значение | Показатель | Регулярные варианты |
indef | неопределенность | tа-, te- | |
приименное отрицание | ni- |
Помета | Значение | Показатель | Регулярные варианты |
subst | субстантивация | -sker | |
cmpr | компаратив | -rak, -rek -tarak, -terek |
Помета | Значение | Показатель | Регулярные варианты |
ord | порядковое числительное | -məʂ, -mёʂ | |
col.p_1pl | собирательное числительное | -səmər, -sёmёr | |
col.p_2pl | -sər, -sёr | ||
col.P_3 | -əʐə, -ёʐë -(ə)ʂ |
||
distr | дистрибутив | -ʂar, -ʂer |
Помета | Значение | Показатель | Регулярные варианты |
npst | непрошедшее время | -a, -e -at, -et |
|
pst | прошедшее время | -r | -rʲ, -t, -ʨ |
cop_pst | копула прошедшего времени | =ʨə, =ʨё | |
plup | плюсквамперфект | -satt, -sett | |
ipf | имперфект | -(a)tt, -(e)tt -(a)tʨ, -(e)tʨ, |
|
fut | будущее время | -ə, -ё -(ʲ)ə, -(ʲ)ё |
|
imp.2sg | императив | — | |
imp.2pl | -ər, -ёr | ||
juss.3sg | юссив | -tər, -tёr | |
juss.3pl | -ʨər, -ʨёr -ʨʨər, -ʨʨёr |
||
sbjv | сослагательное наклонение | -(ə)tt, -(ё)tt |
npst | fut | pst | hort/imp/juss | |
1sg | -p, -əp, -ёp | -əm, -ёm | -am, -em | |
1pl | ‑pər, -pёr | -əmər, -ёmёr | -ar, -er | |
2sg | -n, -ən | -ən | — | |
2pl | -ər, -ёr | -r | -ər, -ёr | |
3sg | -at, -et npst.3sg |
‑(ʲ)ə, -(ʲ)ё fut.3sg |
-ə, -ё | ‑tər, ‑tёr |
3pl | ‑aʨə, -eʨё npst.3pl |
-ɕ | -əɕ, -ёɕ | -ʨər, -ʨёr |
Помета | Значение | Показатель | Регулярные варианты |
inf | инфинитив | -ma, -me | |
inf2 | -maʂkən, -meʂkёn | ||
inf-attr | -ma-la, -me-le | ||
inf-dest | ‑ma-lək, -ma-lёk | ||
pc_prs | причастие настоящего времени | -agan, -egen | |
pc_res | результативное причастие | -an, -en | |
pc_pst | причастие прошедшего времени | -nə, -nё | |
pc_fut | причастие будущего времени | -as, -es | |
pc_pot | потенциальное причастие | -i | |
cv_att | аттенуативное деепричастие | -a, -e | |
cv_sim | деепричастие одновременности | -sa, -se | |
cv_post | постериорное деепричастие | -iʨen | |
cv_ant | антериорное деепричастие | -san, -sassən -sen, -sessёn |
Помета | Значение | Показатель | Регулярные варианты |
pot | потенциалис | ‑il, ‑i | |
refl | рефлексив | ‑ən,-ёn ‑əl,-ёl |
|
caus | каузатив | -tar, -ter | |
att | аттенуатив | -kala, -kele |
Помета | Значение | Показатель | Регулярные варианты |
vbz | вербализатор | -la, -le | |
attr | атрибутив | -la, le | |
attr_temp | темпоральный атрибутив | -xi |
Помета | Значение | Показатель | Регулярные варианты |
emph | эмфаза | -ak, -ek | |
add | аддитивная частица | =ta, =te | |
q | вопросительная частица | =i, =j | |
q2 | вопросительная частица | =ʂɨ | |
‘ведь’ | =(ə)ɕ, =(ё)ɕ | ||
cond | кондиционал | =tək, =tёk | |
ncat | некатегоричность | =xa, =aj, =ej | |
‘оказывается’ | iken | ||
‘вроде’ | ende |
Поиск по глоссам позволяет создавать запросы, касающиеся морфемной структуры словоформ. Поиск по глоссам очень похож на поиск по грамматике, однако позволяет задавать более сложные запросы. В частности, задавать порядок следования граммем и искать формы, содержащие более одного вхождения данной граммемы.
Общие принципы работы поиска по глоссам и основные отличия такого поиска от поиска по грамматике приводятся в разделе «Справка».
При помощи этих полей возможен поиск словоформ в соответствии с русским / английским переводом соответствующих лемм. Например, по запросу «давать» в поле «Перевод (ru)» выдаются все употребления глагола par, корень которого глоссируется в корпусе как «давать». Поиск по переводу не позволяет искать русские или английские словоформы, использованные в переводах чувашских предложений. Например, при помощи этой функции нельзя найти все предложения, в переводах которых используется словоформа «дали». Чтобы найти такие предложения, необходимо воспользоваться полнотекстовым поиском.
Параметры поиска, связанные с говорящим, с которым записан текст, устроены по принципу выпадающих окон, в которых перечислены все встретившиеся в Корпусе значения параметров. Например, в поле «Место рождения» перечислены все места, в которых родились те говорящие, с которыми записаны тексты Корпуса.
Все остальные параметры поиска (полнотекстовый поиск, поиск предложений / слов / корней, выбор подкорпуса, одновременное использование нескольких полей, использование поиска по нескольким словоформам и т.д.) не имеют особенностей, характерных только для чувашского Корпуса.
Тексты до 2017 года были записаны В. М. Филипповой при поддержке А. В. Дыбо. Значительная часть текстов, вошедших в корпус, были записаны и расшифрованы в 2017–2023 гг. отдельными жителями с. Малое Карачкино и участниками экспедиций, организованными М. А. Холодиловой при административной и финансовой поддержке НИУ ВШЭ. Особый вклад в пополнение и обработку текстов внесли жительницы с. Малое Карачкино Вероника Михайловна Филиппова – заведующая Малокарчкинской сельской библиотекой, - и Светлана Ивановна Тобоева – учитель чувашского языка и литературы МБОУ "Малокарачкинская ООШ".
Также в записи и расшифровке текстов принимали участие Кира Александровна Байда, Влада Вячеславовна Баранова, Дмитрий Валентинович Герасимов, Айгуль Наилевна Закирова, Агата Александровна Зорина, Елизавета Александровна Романова, Елизавета Андреевна Рыжкова, Дарья Александровна Сапарова, Наталья Константиновна Тарасова, Максим Леонидович Федотов.
В переводе текстов на английский язык помогали Анна Константиновна Луценко и Анастасия Алексеевна Саунина.
Устный корпус малокарачкинского говора чувашского языка поддерживается Международной лабораторией языковой конвергенции Высшей Школы Экономики.
Авторы корпуса благодарят жителей с. Малое Карачкино за многолетнее гостеприимство и помощь. Без невероятной заботы и терпения, проявленных жителями Малого Карачкина, этот корпус никогда не был бы опубликован.
По содержательным вопросам:
Наталья Логвинова: natalielo009@gmail.com
По техническим вопросам:
Илья Садаков: saltymon@gmail.com
Если Вы используете данные Корпуса в своём исследовании, воспользуйтесь следующей ссылкой: