— Я хочу изучать
Представьте себе интернет. Как он выглядит? Для меня это что-то туманное, висящее в воздухе, пока мы неотрывно смотрим в экраны ноутбуков и телефонов. Он состоит их крошечных движущихся частичек информации. У него нет границ – он бесконечен.
Первым языком, который использовали в интернете, с почти 100% вероятностью был английский. К середине 1990-х гг. 80% информации в интернете было на английском языке.
Однако сейчас ситуация изменилась, и теперь английский – лишь один из языков, на которых чаще всего общаются в интернете (хотя с первого места его так пока никто и не сдвинул). На данный момент английский занимает около 30% киберпространства. В список популярных в сети также входят испанский, арабский, китайский языки. Кстати, использование китайского языка в сети увеличилось на 1277.4% в период с 2000 по 2010 год!
Вот топ-10 самых популярных в сети языков (данные на 31 марта, 2020 года). Они покрывают 82% всей информации в интернете.
Так ли важен язык, на котором вы общаетесь онлайн? Насколько по-разному пользуются интернетом те, у кого родной язык не английский, не испанский, и, скажем, язык Зулу? Язык влияет на то, с кем вы общаетесь в социальных сетях и иногда даже на ваше поведение в онлайн-пространстве. Он определяет, сколько вы сможете прочитать в Википедии (если вообще доступно). Если набрать в Google слово «рестораны» на одном языке, а потом на другом, разница между количеством запросов может отличаться в десятки раз. А если ваш родной язык находится под угрозой вымирания, у вас вообще может не быть онлайн-жизни.
«Всемирная паутина не просто соединяет машины, она соединяет людей». Тим Бернерс-Ли.
Язык также важен для построения человеческих отношений онлайн, как и для реальной жизни: он закладывает основы того, как пользователи воспринимают друг друга, и определяет границы, внутри которых формируются сообщества по интересам.
В Википедии провели исследование. Были изучены страницы, которые вызвали больше всего дискуссий в разных языковых онлайн-сообществах. В англоязычной Википедии в топ-10 вошли страницы “George W.Bush”, “circumcision” и “global warming”. В венгерской – «цыганская преступность», в французской – «НЛО» и «свидетели Иеговы», а в чешской – «телепатия».
В Твиттере, несмотря на то, что английский является самым распространенным языком, 49% твитов написаны на других языках (самые популярные – японский, испанский, португальский и индонезийский). Поведенческий анализ показал, что пользователи Твиттера склонны адресовать свои твиты, ретвиты и комментарии тем пользователям, которые говорят на том же языке, что и они.
Пользователи Твиттера ведут себя по-разному в зависимости от языка, на котором они говорят. Например, по-китайски вы сможете сказать больше, чем по-английски, т.к. 140 иероглифов несут больше смысла, чем 140 букв в английском (в Твиттере есть ограничение – в одном сообщении может быть не больше 140 знаков). Исследование показало, что корейцы используют Твиттер, чтобы общаться друг с другом, немцы – чтобы делиться ссылками и хештэгами, а люди, говорящие на индонезийском языке, делают примерно в 5 раз больше ретвитов, чем те, кто говорят на японском. По данным исследования носители разных языков используют Твиттер для разных целей: одни – для общения, другие – чтобы делиться информацией.
Научный журнал, посвященный межкультурной психологии проанализировал билингвов, которые пользуются английским в Facebook, а в китайской социальной сети Renren – мандаринским диалектом китайского языка. Оказалось, что одни и те же люди вели себя по-разному на разных платформах. В Facebook они были склонны проявлять свою индивидуальность, а на Renren чаще делились постами с участием других людей.
«Знаменитая машина [Google] распознает 30 европейских языков, но при этом поддерживает всего лишь один африканский язык, ни индейского языка и ни одного из языков Океании». Такие данные предоставил в 2012 году Даниэль Прадо, занимающийся исследованиями языкового разнообразия. В то время как Google утверждает, что их главная цель – расширение числа языков, на которых можно будет искать информации, на данный момент большое количество языков по-прежнему не включены в этот список. Одной из причин является то, что многие малораспространенные языки до сих пор представлены лишь в устной форме или не имеют стандартизированной орфографии. Из более, чем 6000 языков «гуглить» можно лишь на 130 языках.
И даже для тех языков, которые использует Google, результаты поиска будут разными. Ученые Марк Грэхэм и Мэтью Зук, находясь на западном берегу реки Иордан (регион на Ближнем Востоке), искали информацию в интернете на иврите, арабском и английском языках. Поисковые запросы на арабском языке оказались на 90% менее результативными, чем те же запросы, но на иврите. Запросы на английском принесли в 4-5 раз больше результатов, чем те же запросы на арабском.
В Википедии ситуация примерно та же. Из 288 языков, используемых на сайте, больше всего статей написано на английском, за ним следуют немецкий и французский. На многих африканских и азиатских языках, напротив, информации практически нет.
И даже если вы говорите на распространенном языке, это еще не значит, что вам доступен весь объем информации. Большинство статей в Википедии написаны только на одном языке и не имеют аналогов на других языках. Википедия – это лишь один пример, однако он ярко иллюстрирует, насколько информация в интернете разнится в зависимости от языка.
Разница в объеме информации, доступной онлайн на разных языках, также связана с тем, кто и что представлено в интернете. И как эта информация в интернет попадает.
Как видно на карте ниже, больше всего информации в Википедии – на английском языке, и английский распространен в большинстве стран. Однако, если посмотреть на ту же карту, но с точки зрения носителя иврита или арабского, картина меняется. Наблюдается огромный информационный вакуум в менее распространенных языках. Взгляните, целые страны погружены в темноту. А если взять еще более редкие языки, например, египетский вариант арабского языка, мы увидим, что южное полушарие Земли практически полностью окрашено в черный цвет.
Источник: Graham, M., Hogan, B., Straumann, R. K., and Medhat, A. 2014. Uneven Geographies of User-Generated Information: Patterns of Increasing Informational Poverty. Annals of the Asociation of American Geographers. 104(4). 746-764.
В том же исследовании на западном берегу реки Иордан выяснилось, что, в зависимости от языка могут меняться даже наши действия. В Google ввели слово «ресторан» на иврите, арабской и английском. Для каждого языка результаты были разными: тех, кто ищет рестораны на арабском языке, Google отправляет в одну часть города, а для тех, кто говорит на иврите, прокладывает маршрут в другую часть города. Получается, что поисковая система влияет на то, как и где проведут свое время носители того или иного языка.
Приложения и сайты-переводчики помогают людям, говорящим на разных языках, понимать друг друга, а также открывают новые возможности для онлайн-бизнеса. В 2015 году Майкрософт выпустил Skype-переводчик, после чего Facebook и Twitter также объединились с поисковой системой Bing, чтобы предоставить своим пользователям возможность автоматического перевода.
Скотт Хэйл, который занимается исследованием данных в Оксфордском интернет-институте, считает, что интернет-платформам следует уделять больше внимания пользователям, которые говорят на двух и более языках. Например, сделать так, чтобы они могли искать информацию сразу на нескольких языках, а также поощрят использование более одного языка. «Многие сайты с отзывами, например, TripAdvisor и Google Play, в первую очередь показывают человеку отзывы на том языке, который установлен у него на устройстве, а иногда и вовсе скрывают отзывы на других языках», говорит Хэйл. По его мнению, платформы вроде Википедии могли бы ввести функцию поиска статей сразу на нескольких языках.
Также Хэйл обнаружил, что среди пользователей Твиттера 11% - мультилингвы. Среди пользователей Википедии таких 15%. И именно эти люди проявляют наибольшую активность в написании твитов или создании и редактировании статей в Википедии.
Интерактивная карта, созданная Массачусетским технологическим институтом, иллюстрирует поведение мультилингвов на этих сайтах. Здесь хорошо видно, между какими языками переключаются пользователи этих платформ (чем толще линия между языками, тем чаще между ними переключаются), и какие языки более изолированы. В Твиттере, как оказалось, большое количество людей, говорящих на малайском, португальском и испанском также пишут твиты на английском. В Википедии число языков, пользователи которых также пишут и читают на английском, еще больше.
В работе “Digital Language Death” исследователь Андраш Комай предсказывает, что 95% современных языков так никогда и не наберут обороты и не станут популярны в сети.
Возможно ли, что из-за интернета многие из мировых языков совсем исчезнут? Проблема лингвистического присутствия в интернете актуальна лишь для тех, кто имеет доступ к всемирной сети, в то время как миллионы людей по-прежнему остаются лишены этого блага цивилизации. Однако, интернет продолжает покорять все новые и новые уголки земли, все больше людей из менее развитых стран выходят в сеть, поэтому вполне возможно, что вскоре другие языки смогут побороться за первое место онлайн.
Существует, кстати, и другая опасность. Новые пользователи, напротив, вместо того, чтобы пользоваться родным языком, могут оказаться под влиянием объема контента на доминирующих языках. Представители языковых меньшинств склонны использовать более распространенные языки в сети, даже если плохо ими владеют. Оно и понятно: если вы говорите на английском и, например, кашмирском (распространен в некоторых регионах Индии и Пакистана) языках, что вы выберете: английскую версию Википедии с >6 000 000 статей или кашмирскую версию с 426 статьями?
В 2011 году ООН объявила доступ в интернет одним из основных прав человека. Однако очевидно, что пока для цифрового равноправия одного лишь доступа в интернет недостаточно.
Источник: The Guardian
Мы свяжемся с Вами в течение часа в рабочее время. Обратите внимание: мы работаем с 9.00 до 18.00 по Московскому времени (GMT+3 часа), выходные - суббота и воскресенье
Мы свяжемся с Вами в течение часа в рабочее время.
Обратите внимание: мы работаем с 9.00 до 18.00 по Московскому времени (GMT+3 часа), выходные - суббота и воскресенье.
Мы свяжемся с Вами в течение часа в рабочее время.
Обратите внимание: мы работаем с 9.00 до 18.00 по Московскому времени (GMT+3 часа), выходные - суббота и воскресенье.
Комментарии (6)