МOСКВA, 10 янв – РИA Нoвoсти. Систeмa искусствeннoгo интeллeктa прoaнaлизирoвaлa пoслeдниe 150 лeт истoрии Вeликoбритaнии пo нeскoльким дeсяткaм гoрoдскиx гaзeт, улoвив всe крупныe истoричeскиe трeнды и выяснив, кoгдa футбoл стал важнее политики, говорится в статье, опубликованной в журнале Proceedings of the National Academy of Sciences.
«Мы показали, что вычислительные методы могут раскрыть важную связь исторических событий и культурных трендов с содержанием большого массива текстов за определенный исторический период. С другой стороны, не все можно автоматизировать – то, насколько важными были эти связи для человечества, может выяснить только человек, и эта часть истории никогда не станет вотчиной машин», — заявил Том Лэнсдолл-Уэлфейр (Tom Landsall-Welfare) из Бристольского университета.
До начала 20 века печатная пресса была фактически единственным источником информации для большинства обывателей, однако ее роль в формировании общественного мнения и политики оставалась почти неизученной. Одна из причин — объем печатных изданий: «ручной» анализ даже нескольких десятков газет за полвека или век потребует нескольких лет, если не десятилетий непрерывной работы. © Computer Vision FreiburgУченые создали программу, способную «перекрасить» кино под Ван Гога
Лэнсдолл-Уэлфейр и его коллеги решили восполнить этот пробел, воспользовавшись двумя продуктами современной цивилизации – нейросетями, которые применяются для анализа баз данных и больших массивов текстов в лингвистике, и электронным архивом газет, который подготавливается частной генеалогической компанией findmypast.
Обширный архив газет findmypast помог ученым проанализировать свыше сотни местных газет и прочих периодических изданий, выходивших на территории Британии с 1800 по 1950 год. В общей сложности за это время их корреспонденты и редакторы подготовили и опубликовали примерно 35 миллионов статей и других текстов, которые содержат около 29 миллиардов слов. Это, по оценкам ученых, около 14% общего объема информации в прессе за весь указанный период.
Для анализа ученые создали систему искусственного интеллекта, которая «читала» газеты, искала в них различные ключевые слова, оценивала частоту их употребления, важность и другие параметры, интересные для историков и культурологов. Это позволило системе ИИ выделить важнейшие и самые резонансные события и раскрыть множество закономерностей, в том числе неочевидных, вытекающих из общей канвы той информации, которая публиковалась газетами в течение полутора веков.© SkoltechУченый: искусственный интеллект приведет к сознательной архаизации жизни
К примеру, 1898 год стал своеобразным историческим водоразделом, при пересечении которого электричество вытеснило пар в сознании британцев. Поезда стали популярнее лошадей спустя еще четыре года. Кроме того, ИИ раскрыл четыре финансовых кризиса 19 века, произошедших в середине 20-х, 40-х, 50-х и 60-х годов.
С точки зрения социальной жизни, крупнейшие изменения произошли на рубеже веков. Начиная примерно с 1890-х годов политика стала стремительно терять в популярности, вытесняясь театром, кино, эстрадой, футболом и другими видами спорта. Перемены коснулись и национальной идентичности: в начале 20 века понятие «Англия» было постепенно вытеснено из жизни «Британией». До этого жители королевства в целом считали себя «англичанами», а не «британцами».© AP Photo/ Winslow TownsonУченые выяснили, почему научные журналы иногда тиражируют ложь
Лэнсдолл-Уэлфейр планирует продолжить анализ газетных данных, перейдя от более общих к более частным закономерностям – в частности, есть замысел вычислить рейтинги политиков, ученых и деятелей культуры. К примеру, уже известно, что лорд Пальмерстон, британский премьер в 1860-х годах, выдвинувший идеи «реальной политики», был более популярен в прессе, чем его главный критик Бенджамин Дизраэли, а политики в целом были более известны и воспринимались более негативно, чем ученые или деятели культуры.