FestivalNauki.ru
En Ru
cентябрь-ноябрь 2019
176 городов
September – November 2019
312 cities
11-13 октября 2019
МГУ | Экспоцентр | 90+ площадок
14–16 октября 2016
Центральная региональная площадка
28–30 октября 2016
ИРНИТУ, Сибэскпоцентр
14–15 октября 2016
Центральная региональная площадка
23 сентября - 8 октября 2017
«ДонЭкспоцентр», ДГТУ
ноябрь-декабрь 2018
МВДЦ «Сибирь»,
Вузы и научные площадки города
6-8 октября 2017
Самарский университет
27-29 октября
Кампус ДВФУ, ВГУЭС
30 сентября - 1 октября
Ледовый каток «Родные города»
21-22 сентября 2018 года
ВКК "Белэкспоцентр"
9-10 ноября 2018 года
Мурманский областной Дворец Культуры

Как интернет изменил лингвистику

Для человека, который хочет изучать язык и его устройство, в интернете доступно невероятное количество данных: самые разные тексты на всех возможных языках. Сейчас мы, например, можем не просто посмотреть, как люди употребляют то или иное новое слово, но и проследить, когда оно появилось в языке и как со временем меняется его значение. Для этого есть много инструментов, и они всё время совершенствуются.

Ведь как было раньше? Выходили, допустим, словари новых слов. Откуда их авторы черпали информацию? В основном из собственных наблюдений: лингвист встречал где-то неизвестное слово, записывал его и постепенно накапливал материал. Но проверить, насколько это слово распространено, было очень трудно. Если сейчас вы заглянете в словарь актуальной лексики начала XXI века, вышедший в 2006 году, то обнаружите там, к примеру, слово «веб-таксофон». Но сейчас этого слова в языке нет, да и тогда, скорее всего, по сути дела не было — поисковые системы почти не находят примеров. Мелькнуло и исчезло. «Спам» и «снек» остались, а «веб-таксофон» нет. Зачастую, пока словарь готовят к изданию, редактируют — пока вся эта работа идёт, слово успевает выйти из активного употребления или изменить значение.

 

Теперь даже для самых новых слов можно быстро получить статистику употребления в интернете.

Есть и методы автоматического выявления новых слов — скажем, в Твиттере. Но пока далеко не всё можно решить без человека. Писали мы как-то статью о сокращённых названиях бытовых предметов. Например, «велосипед» сейчас сокращают не только до знакомого многим «велик», но и до «вел». А если мы начнём изучать это слово в интернете, то столкнёмся с проблемой, а именно с глаголом «вёл» — только без точек. По контексту различить можно, но для этого нужно сесть и разбираться.

Говоря о языке и информационных технологиях, сложно уклониться от вопроса, ухудшает ли интернет грамотность. Однозначного ответа нет. С одной стороны, большинству пользователей интернет заменил орфографический словарь, а это не всегда надёжно. Мой любимый пример — слово «борсетка». Да, именно так, через «о», это слово написано в орфографическом словаре, но написаний через «а» в интернете на порядок больше. Лингвист может обнаружить этот факт и сделать выводы, почему так получилось, чем оправдано одно и другое написание. А неспециалист просто использует вариант, который предлагают поисковые системы, не задумываясь — и тем самым нарушит норму. Для лексикографа интернет как огромное хранилище самых разных текстов — это замечательно, но для нелингвистов интернет как источник сведений об утверждённой норме — скорее плохо.

А хорошо ли, что компьютер и телефон исправляют за нас ошибки? Практика интернет-письма отличается от бумажной. Что написано пером, не вырубишь топором, а в Сети написанное обычно можно исправить. Это приводит к тому, что люди меньше следят за грамотностью: скорость важнее. Да и зачем напрягаться? Гаджеты нас поправят. Когда школьники, да и взрослые, переписываются, а смартфон исправляет их ошибки, это, в принципе, неплохо — лучше, чем создавать неграмотные тексты, которых в интернете и так хватает. Но телефон может сделать такую замену, что потом краснеть придётся: неудачным автоисправлениям посвящены целые разделы юмористических сайтов.

Неудачным автоисправлениям посвящены целые разделы юмористических сайтов.

Впрочем, курьёзами дело не исчерпывается. Ошибки в таких текстах всё равно есть, просто они другие — их сложно исправить автоматически. Например, если я напишу «какова черта» вместо «какого чёрта», машина не исправит написанное, потому что оба этих слова существуют, а определить смысл высказывания гораздо сложнее, чем проверить его написание. Системы проверки орфографии постоянно совершенствуются, но главный принцип сохраняется: необычные написания исправляются на более частотные. А это не всегда уместно.

Например, я часто использую в переписке аббревиатуру ЗК — задачная комиссия олимпиады по лингвистике. А программа Punto постоянно переключает раскладку и исправляет ЗК на PR. Понятно, что для большинства людей PR важнее, чем ЗК (кстати, и аббревиатура-то эта, ЗК, обычно означает вовсе не задачную комиссию). Но лично я про PR вообще не пишу, а про ЗК — часто. Это то, что в компьютерной лингвистике называется «длинный хвост». Статистика может много чего решить, может быть, 90% задач, но дальше остаётся длинный хвост из огромного количества очень редких случаев. У кого-то ЗК, у кого-то домашнее имя, кто-то из принципа в шутку всегда пишет не АнЕчка, а АнИчка. Это как если бы мы писали в школе записки одноклассникам, а кто-то сидел рядом и исправлял: думаю, нам бы показалось это неуместным.

А в интернете вообще те же нормы, что в офлайне? Не совсем.

Лингвисты изучают интернет в том числе как среду коммуникации, и действительно — люди здесь пишут не так, как в других местах. Этой теме посвящён ряд исследований. В интернете пишут быстрее, меньше следят за аккуратностью и грамотностью; иногда и просто новые нормы рождаются. Например, в школе нас учат ставить точку после предложения; в интернете после реплик в диалоге точки можно увидеть всё реже. А если они вдруг появляются, это может восприниматься как проявление агрессии.

Аналогично с большими буквами: мы гораздо реже используем их в Сети (или в сети?). Некоторые люди и вовсе пишут только с маленькой, даже имена и в начале предложения — не потому, что они безграмотные, а вполне осознанно. Хочу и пишу всё маленькими буквами, это создаёт одно впечатление, хочу — всё большими, совсем другое.

С кавычками история тоже меняется. Например, вот мы играем в «Шляпу» или в шляпу? Вроде бы это название игры и кавычки нужны. Но вот футбол — тоже игра, название которой, как и в «Шляпе», происходит от предмета, который для этой игры нужен: football, футбольный мяч. Футбол всегда пишут с маленькой буквы, а игру в шляпу — не всегда, но в интернете чаще. Играть в «Дочки-матери» или в дочки-матери? В «Магазин» или в магазин? На интернет-форумах кавычек и больших букв здесь не будет, а в бумажных журналах редакторы могут и поставить. Даже дети, которые ведут активную онлайн-переписку, ощущают, что здесь другие правила. Они могут специально писать «харашо» вместо «хорошо» — не потому, что не знают, как правильно, и не потому, что так быстрее. Тут такие правила — это чат, а не контрольная.

Ну, скажет кто-то, выходит, что интернет — рай для лингвиста, но ад для учителяНа самом деле всё несколько сложнее. Интернет — это разнообразие и огромные возможности для самовыражения, что, конечно, здорово. Но многие, прежде всего дети — те, кто ещё не усвоил нормы, — склонны воспринимать вариации как эталон. Раньше считалось, что человек, который много читает, имеет все шансы быть грамотным. Теперь же дети читают далеко не только учебники и хорошо отредактированные книги, и обилие неграмотных текстов действительно может плохо сказаться на умении писать без орфографических ошибок. Но, с другой стороны, школьное сочинение с ошибками прочтёт только учитель, а пост в интернете увидят и, возможно, прокомментируют — укажут на ошибки — разные люди, так что появляется новый стимул писать грамотно. Что окажется важнее, ещё предстоит выяснить, и это очень интересно!

Борис Иомдин
Кандидат филологических наук, доцент Школы лингвистики НИУ ВШЭ, преподаватель Школы анализа данных «Яндекса», заведующий сектором теоретической семантики и ведущий научный сотрудник Института русского языка им. В. В. Виноградова РАН.


Иллюстрации

Маргарита Ворон

 

Добавьте свой комментарий

Plain text

  • Переносы строк и абзацы формируются автоматически
  • Разрешённые HTML-теги: <p> <br>
LiveJournal
Регистрация

Новости в фейсбук

Случайные статьи

Когда повышенная иммунная боеготовность оказывается не к месту

Бедность может вредить мозгу, а богатство?

У бедных детей обычно хуже идут дела в школе. Дети из богатых семей справляются лучше. Бедность, похоже, тянется как некая гнетущая нить, через поколения. Богатство тоже связывает поколения, но у этой нити более шелковистый блеск. В этом нет великого открытия.

Ученые показали, как эволюционно древний механизм биосинтеза белка помогает клетке противостоять стрессу

Энергозатраты на производство материалов

Чтобы в экономике началось движение материалов, необходима энергия, которая уходит на добычу их из природных месторождений или на их промышленное производство от простой механической обработки до сложных химических реакций.

Иду на вы

«Будь вежливым — и ты завоюешь мир!» — такова школьная истина.