ТЕМА НОМЕРА ПОЛЕМИКА
ГЕРАЛЬДИКА И ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
Применение современных технологий в науке является актуальной и дискуссионной темой. Искусственный интеллект уже много лет используется как инструмент в различных областях человеческого знания. Созданные на его основе нейросети отрывают для исследователей новые возможности, которые становятся доступны и для гуманитарных исследований. Не остается в стороне и геральдика, как довольно узкоспециализированное направление исторической науки. Именно поэтому заместителем главного редактора журнала Гербовый курьер Игорем Михайловичем Афонасенко, в рамках рубрики Полемика был организован виртуальный круглый стол Геральдика и искусственный интеллект где свое мнение смогли высказать исследователи, непосредственно коснувшиеся этой темы. Редакция Гербового курьера надеется, что данная публикация послужит началом к продуктивной дискуссии.
Евгений Владимирович ПЧЕЛОВ, к н., доцент, заведующий кафедрой вспомогательных исторических дисциплин и археографии Историко архивного института РГГУ, г. Москва Насколько я понимаю, применение ИИ в геральдике мыслится в двух направлениях.
Во первых, это создание баз данных, неких классификаторов гербов, с помощью которых возможна их атрибуция и систематизация. Это, бесспорно, чрезвычайно важная задача, которую ставил еще в до компьютерную эпоху наш классик Владислав Крескентьевич Лукомский, бывший большим специалистом в области гербовой атрибуции или, как он говорил, гербовой экспертизы. Эмблематический гербовник, с помощью которого можно было атрибутировать российские дворянские гербы, был задуман им еще до революции в пору преподавания в Петербургском Археологическом институте. Затем он эту идею частично воплотил в годы работы на кафедре вспомогательных исторических дисциплин Историко архивного института, создав в содружестве с художником А Толоконниковым в 1944 г. известный Эмблематический гербовник Он мыслился именно как определить гербов по эмблематическим изображениях в них. Потом в раннюю пору ЭВМ этим занимался И Борисов, создав свой эмблематический гербовник для русской дворянской геральдики, оставшийся неопубликованным. Недавно М Пашков издал свой гербовый определитель, построенный по иному принципу, но помогающий именно в атрибуции для других задач он сложно применим Конечно, было бы крайне полезно хотя бы по дореволюционной русской геральдике создать некий универсальный электронный или ИИ словарь опреде литель, с помощью которого можно было бы осуществлять поиск по самым разным и нескольким одновременно элементам герба причем по всем из них, включая самые дробные например, тинктуры и положения фигур. Кто может осуществить такую задачу, не знаю. Но насущная необходимость в этом, безусловно, есть.
Во вторых, это распознавание геральдических тестов и изображений. Что касается распознавания, то я крайне скептически смотрю на возможность реализации этой задачи. Все программы распознавания рукописного текста, широко разрекламированные в последнее время Яндекс архивы Russian generiс handwriting Ryсhkov arсhive Russian сhurсh slavoniс и т абсолютно несовершенны. О программе распознавания метрических книг я вообще молчу ею пользоваться практически невозможно, это абракадабра. Проект Диджитал Петр предназначавшийся изначально для расшифровки автографов Петра I с использованием ИИ в принципе неизвестно для кого создан. Он может выполнять разве что чисто вспомогательную функцию. Настоящий специалист будет всегда смотреть сам подлинный текст. Убежден, что никакой компьютер и ИИ в области палеографии не сможет заменить во всяком случае, на современном этапе человека. То же, думаю, относится и к геральдике. Да и толку в такой программе, при реализации первого гипотетического проекта по созданию универсального электронного или ИИ словаря определителя никакого не будет.
Что касается создания новых гербов с помощью искусственного интеллекта, то такая возможность имеется. Но этот вопрос лежит совершенно вне сферы моего интереса.
Юрий Юрьевич РОСИЧ, к н., главный редактор сетевого издания Геральдика.ру и печатного журнала Гербовый курьер г. Москва Сама используемая в СМИ в настоящее время терминология в виде слов искусственный интеллект самоочевидно, носит спекулятивный характер. Несомненно, что компьютерные технологии в области обработки информации, ее анализа и умения на ее основе создавать компиляции, а также на подобных же принципах и создания изображений компьютерными программами, за последние 2 3 года сделали огромный скачок в развитии. Но называть эти достижения компьютерных нейросетей именно искусственным интеллектом все же очень сильное преувеличение. Мы пока имеем дело только с заданными в программах алгоритмами, которые сами ничего принципиально нового не соз дают, но вот в умении компилировать достигли довольно высокого уровня, кое в чем уже превосходя среднестатистическго человека.
Но даже на уже достигнутом уровне для геральдики такие программы весьма перспективны именно в плане упрощения сбора информации, ее анализа, а также для атрибутирования артефактов.
Но именно что перспективны, т до практического применения именно в геральдике все это еще не дошло. Технология пока полностью находится в руках программистов, и ее требуется допиливать до каждой узкоспециализированной сферы использования. Какой является и геральдика с ее специфическими законами и традициями. Гербы это не просто няшные картинки, которые нейросеть может генерировать на основе прочих изображений в Интернете. Гербы нужно еще проверять на правильность составления а вот эти особенности ни один программист без привлечения реального профессионального геральдиста заложить в алгоритмы не сможет. Давайте, честно признаемся себе и другим не надо преувеличивать значимость именно геральдики для айтишников, компьютерных инженеров и развития общества в целом. Геральдика находится на периферии основных социальных, политических и культурологических интересов и запросов общества. Так что и руки до адаптации именно геральдических нюансов в нейросетях дойдут далеко не в первую очередь.
В этом вопросе крайне важен и финансовый аспект. На данный момент, допилить алгоритмы нейросетей для использования в каждой конкретной сфере под силу только крупным корпорациям в нашей стране таким, как Яндекс или Сбербанк. И их проекты в этой области как раз и общеизвестны ЯндексGPT, для генерации текстов, и сберовский Кандинский для генерации изображений. Таким образом, для полноценной адаптации нужны сейчас даже не миллионы, а миллиарды рублей. Нанять программистов такого уровня для решения геральдических задач в настоящее время это из области фантастики. Я крайне сомневаюсь, что у корпорации уровня Яндекса может быть минимальный интерес к геральдике на этой крайне узкой сфере такие сложные и дорогие технологии окупить невозможно.
Отсюда и ответ насколько эти инструменты пря мо сейчас применимы профессиональными геральдистами. Можете сами проверить но мне ответ очевиден, пока, скорее, для развлечения например, посмотреть какую красивую картинку выдаст нейросеть по запросу, найти в ней массу ошибок и остаться довольным, что нейросеть глупее Тот же Яндекс, даже вне контекста нейросетей, до сих пор не научился адекватно находить просто похожие изображения гербов. Во многих случаях поисковая система находит гербы с подобными формами щитов, венков и лент вообще вот это для Яндекса до сих пор и есть похожесть гербов, а не по набору фигур в них изображенных. Так что програм мистам Яндекса еще предстоит огромный пласт работ впереди по уточнению своих алгоритмов.
Но я не сомневаюсь, что в перспективе технология нейросетей будет доработана, включена в базовые библиотеки всех основных языков программирования и операционных систем. После чего уже программисты средней руки начнут делать на ее основе пользовательские программы и вот только тогда и можно будет говорить о нейросетевой революции в геральдике. Но это среднесрочная, а не ближнесрочная перспектива. Но я также не сомневаюсь и в том, что точно рано или поздно смогу сам применять такие алгоритмы. Но время таких решений еще не наступило.
Так как в технологии нейросетей от интеллекта пока только название, то тем сферам деятельности, где требуется креативность, ИИ пока не угрожает. А вот чем ниже запрос на креативность в поставленной задаче, тем лучше с ней ИИ справится уже сейчас. Особенно с учетом того, насколько геральдическое невежество в нашем обществе процветает и без всякого ИИ, и насколько соблюдение геральдических правил и традиций российской геральдики требуется де факто, а не де юре, в большинстве случаев, где необходимость профессиональной геральдической экспертизы попросту даже не заявлена.
По аналогии с тем, что Яндекс уже делает с генеалогической информацией в архивах, подобным же образом могла бы быть поставлена задача и по систематизации геральдических архивных материалов и быстрого поиска по уже оцифрованным делам в федеральных и областных архивах. Пока же даже доступ к уже оцифрованным материалам крайне затруднен хотя этот вопрос даже не к ИИ, а вообще к государственной политике в области архивного дела. А так, в перспективе, то, что заняло у инициативной группы единомышленников несколько лет ранее на создание Эмблематического гербовника дворянских гербов ИИ мог бы сделать явно на многие порядки времени быстрее. Хотя и сама необходимость в таком эмблематическом гербовнике с ИИ отпадает вообще конечно, не прямо сейчас, а после доработки алгоритмов, но ИИ явно будет в состоянии почти сразу определить принадлежность любого герба. Так что музейным работникам, архивариусам и просто коллекционерам ИИ неизбежно в будущем окажет неоценимую помощь. А ниша работы для привлечения именно специалистов по атрибуции гербов уменьшится весьма значительно.
Для практикующего же геральдиста наиболее интригующий момент заключается в том, насколько качественно ИИ сможет придумывать новые гербы или хотя бы создавать новые графические стилизации уже существующих. Т сможет ли нейросеть скоро заменить геральдиста человека вообще.
На практике в течение лета и осени 2023 г. мне уже присылали для включения в Общественный гербовник Геральдики.ру проекты гербов, созданных нейросетями, с небольшими корректировками вручную в графических программах. Естественно о соответствии таких проектов правилам и требованиям геральдики говорить пока не приходится.
Также несколько раз в качестве первоначальных концептов и идей для разработки герба мне присылали графические изображения, созданные нейросетями Midjourney, DALL E или отечественным Kandinsky. Почти всегда там обнаруживались откровенные ляпы в виде рук или лап в местах, откуда они выходить не должны, или почему то даже безголовых существ. Но, тем не менее, для отработки и поиска идей для гербов и эмблем, нейросети вполне уже могут применяться. Главное, чтобы доведение проекта до ума затем все же было доверено профессионалу. Но это уже вопрос не к нейросетям.
Могу в качестве практического примера еще рассказать об особом опыте именно на уровне создания и отработки программных алгоритмов. Несколько лет назад в рамках Геральдики.ру я начал прорабатывать проект онлайн конструктора для создания личных гербов Создай свой герб сам Он сейчас доступен на сайте любому желающему, и с каждым месяцем им пользуется все больше и больше пользователей. Конструктор весьма примитивен на самом деле и позволяет решать только самые общие задачи. И задумывался то именно как инструмент для помощи в поиске только наиболее общих идей для герба, чтобы потом их можно было довести до ума, хотя бы проконсультировавшись с профессиональным геральдистом. Но речь теперь надо вести совершенно о другом такого рода интерактивный онлайн инструмент и именно на таком устаревшем технологическом базисе развивать дальше нет смысла. Благоразумнее дождаться того момента, когда технология генерации изображений нейросетями станет общедоступной на уровне библиотек к стандартным средствам веб программи рования как PHP и внедрять уже эти алгоритмы.
В любом случае, дизайнер, не сведущий в геральдике, даже при генерировании графики нейросетью, все равно повторит те же самые ошибки, что он бы сделал и без нее. Но начала формироваться целая ниша дизайнеров, берущих за основу изображения, созданные ИИ, а затем вручную их доводящих до нужной степени креативности, исправляя в них все ляпы. Подобного рода проекты уже стали появляться и на различных геральдических конкурсах разного уровня от создания герба школы до создания герба муниципального образования. И даже выигрывать в них ибо выглядят такие проекты очень красиво и выделяются на фоне детских рисунков несопоставимым образом.
Но это все же довольно узкая сфера использования. Я могу привести намного более значимый пример происходящего прямо сейчас в гораздо более обширной сфере в сфере стоковой фотографии. Здесь можно смело говорить об очень скорой смерти этой индустрии в том виде, в какой она просуществовала предыдущие 20 лет, когда микростоки быстро потеснили макростоки. Революция здесь сейчас еще глубже и уже глобально сравнима с тем, что произошло в конце XIX в. с классическим искусством, буквально убитым фотографией. Теперь же пришла очередь и фотографов. Речь, конечно, не идет о фотошедеврах но с созданием фотореалистичных изображений на любую общую тему нейросети уже справляются очень хорошо, и у них вообще нет проблем с завалами горизонта, аберрациями и прочими проблемами оптики и криво держащих фотоаппараты рук. Собственно фотография, как искусство, неизбежно станет настолько же узконишевой как и когда то ранее портретная живопись. И ранее то роль фотографа уже свелась больше к обработке сделанных фотографий различными программными эффектами, а теперь даже фотомоделей можно не искать нейросеть подставит любой нужный типаж лица любых нужной этнической группы, пола и возраста. Как и нет больше смысла тратить средства на аренду профессиональной студии или подбирать подходящий интерьер для съемки. Все, что нужно, нейросеть теперь дорисует сама по набору ключевых слов и с учетом выбранного стиля графики.
Аналогичным образом это будет происходить и в геральдике. Тот же определитель идентификатор гербов, само собой необходим, но само развитие технологии ИИ ведет к тому, что он появится независимо от геральдистов и их желаний. Также как не так уж и давно ранее Яндекс или Google стали использоваться для поиска сначала просто информации о гербах, а затем и их изображений.
Уточнение алгоритмов работы нейросетей делается сейчас, игнорируя геральдику, но неизбежно охватит и ее. Мы не можем равно ни этому помешать, как и пока что помочь сейчас тоже еще не можем. Необходимые алгоритмы обучения ИИ именно геральдике еще не заложены в нейросети их программистами. Пока технология ИИ на данном этапе отрабатывается в более глобальных сферах применения.
К тому же создание глобального нейросетевого определителя гербов зависит не только от ИИ как такового точнее уже надо говорить о таковых во множественном числе но еще и от бюрократических препятствий, а также от степени оцифровки гербовых дел в государственных и муниципальных архивах и открытости доступа к ним. Так что без человека все же пока никак.
Если в XIX в. гербы рисовали на бумаге, в начале XXI в компьютерных векторных редакторах, то лет через 10 20 будут рисовать особые нейронные графические алгоритмы ИИ а название им обязательно еще придумают
Игорь Михайлович АФОНАСЕНКО, магистр истории, зам. главного редактора журнала Гербовый курьер г. Брянск Нейросети это, на данный момент, самый совершенный и самый недооцененный инструмент науки. Во всем мире эти технологии развиваются и приспосабливаются под нужды человека во многих сферах жизнедеятельности. Тот факт, что нейросети это обучаемый и приспосабливаемый ИИ, позволяет обучить его почти всему, что умеет и знает человек. То, что мы называем творчеством, вполне доступно и ИИ, поскольку это также подчиняется определенным алгоритмам. Именно поэтому нейросети уже вовсю используются в технических науках и постепенно интегрируются в гуманитарные.
Российские геральдисты, в основной своей массе, не только не понимают и не умеют пользоваться современными технологиями в науке, но зачастую отрицают их пользу и называют чуть ли не мракобесием Такое отношение показывает ограниченность мышления Хотя, тут есть и значительная доля лукавства многие просто опасаются конкуренции со стороны искусственного ИИ. Не секрет, что весь бизнес геральдистов сейчас строится на том, что вокруг геральдики как территориальной, так и родовой создан некий ореол сложной и недоступной для большинства людей науки, где только специалисты знают и понимают, как создать правильный герб. Именно поэтому муниципальные образования, даже при чрезвычайно скудных бюджетах, вынуждены обращаться за платными услугами в геральдические конторы или к отдельным деятелям, чтобы создать герб и зарегистрировать его, как предписывает закон об общих принципах организации местного самоуправления в Российской Федерации. И, если будет создана профессиональная нейросеть, которая сможет бесплатно и качественно создавать гербы, то бизнес герботворцев просто рухнет.
А это уже не фантастика. Современные технологии вполне позволяют создать и, что самое главное, обучить нейросеть для решений целого спектра геральдических задач от атрибуции и классификации гербов до создания огромных баз данных и их обработки по запросу. А задача по созданию новых гербов, которые будут генерироваться уникальными, и притом по всем правилам геральдики, с элементами творческого мышления это возможно уже сегодня. Просто пока никто не поставил себе такую задачу математике, физике, химии, биологии, астрономии и т нейросети уже обучены, а геральдике пока никто их не научил. Пока. На практике это не сложнее чем научить ИИ любой другой науке. Не каждому человеческому мозгу доступна высшая математика или квантовая физика, а для ИИ это семечки Геральдисты, на уровни некой корпоративной солидарности, в глазах общества усложняют свое ремесло, но, на самом деле, для нейросетей это просто еще одно умение, которому можно научиться за короткий срок.
Самое главное, что для создания таких систем уже есть все составляющие. Технологически это уже реально для современных нейросетей. Методологически такие системы классификации, поиска, систематизации и атрибуции развивались еще в XIX веке европейский Общий гербовник Й. Б. Рьетстапа и созданный на его основе семитомный Словарь геральдических фигур Теодора де Ренесса, представляли собой первую универсальную геральдическую систему поиска и атрибуции, построенную на классификации и систематизации. Геральдическая система Ренесса Рьетстапа включала более 120000 гербов. В России это же попытались осуществить в конце XIX веке, отдельно по территориальным гербам и родовым гербам, на уровне Гербового отделения герольдмейстер Евграф Евграфович Рейтерн и секретарь отделения Виктор Эдуардович Горн. Даже для ЭВМ такие попытки уже были в России.
При настоящей кооперации геральдистов, задача по заполнению базы данных современных территориальных гербов вполне осуществима, тем более что уже много лет существуют сайты, которые имеют свои каталоги современной геральдики. Есть определенная сложность с пополнением базы данных родовыми гербами Российской империи, поскольку немало оригиналов Высочайше утвержденных гербов до сих пор находятся в единственном экземпляре в Российской государственном архиве древних актов и Российском государственном историческом архиве. Но эта проблема решается финансовым путем т либо заказом копирования этих гербов или заключением договора с архивами по использованию изображений. Это вполне реально, поскольку уже есть договоры Яндекса и Google с архивами и библиотеками, как в России, так и в Европе и США.
Главная проблема сейчас, на мой взгляд, это инертность и эгоизм самого геральдического сообщества. Поскольку для осуществления каких то глобальных планов и решения больших задач нужна консолидация. Объединение усилий. Этому мешает лень и эгоизм. Про финансовые соображения тоже забывать нельзя. Не секрет, что многие геральдисты занимаются герботворчеством ради денег, славы и аплодисментов коллег, а красивые слова про высокое искусство, науку и все остальное это только для публики. При таком подходе невозможно осуществить даже элементарные научные проекты. В принципе, в российской геральдике сейчас так и происходит. Это должно измениться.
Но, есть еще один аспект актуализация. Геральдические исследования должны быть востребованы, они должны иметь практическую направленность. Обучать нейросеть геральдике имеет смысл, только если геральдика будет востребованной областью знаний и практических умений. А если она будет уделом горстки энтузиастов и не нужна и не понятна большинству, тогда это просто бесперспективно. В этой связи, плохую службу геральдике служат те геральдисты, которые целенаправленно создают химерные и саркастичные гербы, вопреки пожеланиям самих армигеров т жителей муниципального образования. Прикрываясь своим видением геральдики и защищая якобы ее чистоту Такие гениальные творения вызывают отторжение в обществе и настраивают чиновников и простых людей против геральдики. А должно быть наоборот в обществе должны понимать и уважать геральдику, считать ее полезной и нужной, чтобы она стала актуальной.
Я очень надеюсь, что наша дискуссия поможет изменить отношение геральдистов к современным технологиям и позволит начать постепенное движение к большей открытости. Использование ИИ поможет вывести геральдику на новый уровень и позволит значительно увеличить инструментарий исследователя и практика.
Татьяна Николаевна ФОМИЧЕВА, специалист по цифровой обработке изображения, независимый исследователь геральдики, г. Санкт Петер бург В 2023 году несколько IT компаний OpenAI, Miсrosoft, Google, Midjourney, Antropiс и др. представили больше дюжины нового типа нейросетей, работающих с изображением и мультимодальными данными. Полагаю, это и есть искомый инструмент именно нейросети, или языковые модели, помогут нам в построении гербового определителя.
Не исключено, что кто то в мире уже работает над созданием геральдических нейросетей. Но, как мне кажется, у российских геральдистов есть резоны развивать свою модель. Причины в следующем. 1Комфорт работы с инструментом, заточенным под нужды отечественного геральдического сообщества и под особенности нашего гербового субстрата.
2. Скорость обретения программного продукта. Если мы будем надеяться на то, что российский контент когда нибудь подтянут в условно единую мировую базу геральдических данных, то мы можем не дождаться, как не дождались единой отечественной электронной базы.
3. Наша программистская школа специалистов много, и они мирового уровня. В крупных городах есть лаборатории искусственного интеллекта, школы анализа данных, прикладные центры машинного обучения, факультеты математики и компьютерных наук в вузах, и т и т
4. Задел в смежных дисциплинах, и им нужно воспользоваться.
Компьютерная база для систематизации, каталогизации, статистической обработки, для нужд атрибутирования и экспертизы гербовых изображений, по хорошему, могла быть построена 20 30 лет назад и без ИИ. Базу можно было бы устроить по принципу, предложенному Александром Константиновичем Грефенштейном в докладе Гербовый определитель как гипотеза в октябре 2023 г. на конференции Знаки. Эмблемы. Гербы ИВИ РАН. Возможно, раньше не хватало технического и ментального ресурсов для работы с неупорядоченными данными. А теперь этот дефицит устранен выделение признаков из плохо структурированных данных это больше не человеческая забота.
Экзерсис Грефенштейна выглядит архаично, но наводит на мысль, что новым инструментом мы сможем отблазонировать весь наличествующий гербовый контент, но не с целью заместить старые блазоны, а с целью создать некий надстроечный текстовый уровень для облегчения и человеку, и машине работы с базой. Блазонный новояз унифицированные по структуре блазоны расширит возможности практической и исследовательской работы.
Даже не специализированные нейросети прямо сегодня дают нам следующие возможности 1генерация изображения по текстовому описанию
2 распознавание изображения и его текстовое описание на естественном не машинном языке.
Первая, генерация, будет, наверное, больше интересовать художников, стилизаторов Перерисуй мне том 12 Общего гербовника в стиле Грюненберга и авторов вновь создаваемых гербов Создай мне 10 вариантов герба условного села Новогеральдищево, со свинофермой и окруженного непроходимыми дубовыми рощами вторая возможность интересует нас как будущих создателей условного Нового определителя гербов
Важнейшее свойство ИИ для нас обучаемость, реализуемая технологиями deep learning, supervized learning Обученная на сравнительно небольшой выборке гербов с блазонами тут важно не забывать о качестве сырья ИИ модель не только распознает предоставленный ей весь остальной массив геральдических данных, но и справится с задачей параметризации многообразия материала, как текстового, так и графического. Более совершенный, по сравнению с человеческим, аналитический аппарат ученого робота упорядочит, выявит зависимости, обнаружит системности, позволит произвести все виды логических манипуляций с информацией. Научившись собирать данные из интернет источ ников, модель сможет достроить корпус своего зна ния, расширив его далеко за пределы гербовников, реестров, титулярников к ним можно будет добавить несистематизированные гербовые изображения с каменных надгробий, фасадной лепнины, печатей, офортных отпечатков, живописных холстов, керамики и фарфора, оружия и бытовых предметов, витражей, тканей и т. д. Наконец, для многих будет важно, что обращаться к определителю можно текстом в вольном стиле или голосом, как к голосовому помощнику.
Любопытны реакции геральдического сообщества на предложение освоить новые блага цивилизации. Знатоки говорят Мне не нужен гербовый определитель, я и так все помню Составители баз, травмированные экселевскими таблицами, сетуют Предстоит колоссальная работа Кто то рвется в бой, не щадя бумаги на грантовые заявки, чтобы стать первопроходцем и устроить все по своему, а кто то отмахивается Сколько таких технологических революций, реальных и мнимых, мы уже видели за свою жизнь
Однако поздно закрывать глаза на то, что компьютер научился неплохо видеть и лучше, чем человек, анализировать информацию глубокие сети это уже стандарт в области обработки и распознавания изображения. Для искусственного интеллекта геральдика довольно узкая как, например, распознавание голоса тема, в которой задачи могут решаться с высокой точностью.
Любая работа над условным Новым определителем гербов должна начаться с размеченного геральдическими специалистами датасета базы данных и чем больше будет база атрибутированного материала, тем лучший результат дадут алгоритмы машинного обучения. Возможно, прямо на этом этапе нам придется задуматься над новыми способами учета и описания гербовых объектов.
Дообучение позволит постепенно нарастить и причесать плохоструктурированные данные из разношерстных источников.
Нет сомнения, что новый инструмент выведет на поверхность новую научную проблематику, появятся неожиданные исследовательские задачи и их решения, как это произошло в других областях ученые быстро научились извлекать практический эффект из языковых моделей. Кроме всего прочего, с помощью Нового определителя гербов на основе ИИ можно закрыть вопрос о сборе всего отечественного гербового материала в одном месте, в одном хранилище, на одном сайте с единым интерфейсом.
Самый волнующий вопрос кто всем этим займется Отрадно, что сегодня для этого не нужны мощности целого НИИ. В принципе, любой желающий может приобрести копию нейросети и нанять программистов для создания своего сайта, Telegram бота или мобильного приложения а у вас в смартфоне есть определитель растений или грибов Кто сделает, тот герой. А если это сделают несколько независимых энтузиастов, то мы сможем оценить и сравнить результаты.
Но можно привычным образом подойти к решению задачи назначить ответственных, выделить ресурсы, создать рабочий коллектив и экспертный совет, распределить задачи и т в общем, воспроизвести всю ту последовательность действий, которую подразумевают, когда говорят о научной организации. А о ценности и значимости научной организации мы не устаем вспоминать на хороших конференциях, приводящих к таким вот идеям и дискуссиям усилия организаторов так или иначе окупаются.
Марк Михайлович ПАШКОВ, специалист по геральдической атрибуции, г. Челябинск В настоящее время активно развивается процесс создания ИИ моделей, предназначенных, прежде всего, для решения художественных задач. При создании новых гербов они уже сейчас могут помочь составить герб по заданным промптам подсказкам при условии того, что используется наиболее распространенная геральдическая терминология на английском языке. Уже существуют геральдические онлайн генераторы, позволяющие составить простой герб, или поэкспериментировать с дизайном и художественным оформлением геральдического изображения. Кроме того, ИИ модели могут помочь установить фон бэкграунд композиции, что позволяет увидеть герб в разных положениях и на различных материалах, особенно в интерьере и экстерьере. Также ИИ инструменты часто используются для улучшения качества плохого изображения и преобразования колоризации черно белого изображения герба в цветное правда, не всегда корректного
Мне как практикующему геральдисту атрибу тору, чья работа в основном связана с поиском конкретных гербов по имеющимся изображениям, существующие ИИ модели, к сожалению, мало чем могут помочь. Однако, я вижу перспективы улучшения качества поиска при использовании ИИ в будущем. Поиск по изображениям в поисковых интернет системах таких как Google и Яндекс уже сейчас позволяет достаточно быстро найти и правильно определить герб, при условии, что он оцифрован и известен. Применение алгоритмов ИИ в поисковых запросах позволит на порядок быстрее и точнее использовать эти поисковые системы.
Довольно мощным инструментом могла бы стать условная универсальная геральдическая ИИ модель, которая включала бы все известные на сегодня оцифрованные изображения гербов в мире. Создание такой глобальной модели позволило бы учесть большинство известных гербов и эмблематических изображений родовых, территориальных, исторических, фантазийных, эмблем и логотипов, и т После этого, можно было бы говорить о локализации этой глобальной системы на русском языке с использованием русской геральдической терминологии. Это связано с тем, что количество российских гербов, как родовых, так и территориальных, не очень велико максимум несколько десятков тысяч чего недостаточно для создания собственной ИИ модели. Кроме того, шансы на успешный поиск гербов с помощью глобальной системы резко вырастают, учитывая то, что в мире в целом существовали и существуют миллионы гербов и эмблем.
Более близкой и реалистичной целью может стать создание совместимых с ИИ наборов и баз данных локальных специфических групп гербов. В качестве удачного примера работы такого рода можно привести набор данных немецких муниципальных гербов, составленный Йоханнесом Кольбе, и включающий в себя более 13 тысяч блазонов и рисунков гербов со множеством дополнительных сведений историческими справками, перечнями фигур в том или ином гербе, фамилиями авторов современных гербов, датами утверждений и изменений гербов, указаниями на территориальные переподчинения и принадлежность муниципалитета административным единицам более высокого порядка и т
Таким образом, при решении задачи составления базы или набора данных российских родовых и территориальных гербов для их успешного поиска и научного анализа в различных аспектах требуется прежде всего собрать максимум сведений о каждом гербе, что позволит пользователю искать и анализировать герб или группы гербов не только по фигурам, фрагментам описания, фамилии владельца или названию территориальной единицы, но и по другим имеющимся данным периоду утверждения или изменения, территориальной принадлежности, разным графическим вариантам, для современных гербов фамилиям их авторов, и прочим сведениям.
Также определенную сложность может представить процесс обучения будущей модели ИИ геральдической терминологии на русском языке, которая до сих пор во многих случаях не является ни общепризнанной, ни грамматически и стилистически правильной, ни широко используемой. Поэтому для моделей типа text to image преобразование текста в изображение целесообразно сначала использовать более устоявшуюся в международной геральдической практике англоязычную или франкоязычную терминологию.
Опыт создания Эмблематического гербовника М., 2020 как структурированного собрания гербов в бумажном виде в целях атрибуции и научно геральдических исследований, показал, что для максимальной полезности и удобства использования материала исследователями в каждом гербе необходимо не просто выделять основную первую фигуру, но и анатомировать герб на все элементы и фигуры, которые можно корректно выделить и обозначить. Это крайне трудоемко, хотя нужно отметить, что в истории российской родовой геральдики подобные работы были например, рукопись И Борисова Возможно, в решении этой проблемы в будущем также смогут помочь геральдически специфические ИИ модели. С их помощью можно будет удобно, быстро и результативно искать и находить гербы, как по текстовым элементам блазоны и девизы так и по графическим форма щита, его деление, основные группы фигур, внещитовые элементы нашлемники, щитодержатели, и т
Естественно, что в условиях жесткой международной конкуренции и необходимости значительных финансовых затрат создание даже самой простой, но релевантной современному уровню развития ИИ геральдической базы данных не говоря уже о ИИ модели требует определенной ресурсной помощи со стороны государства. Однако, наша реальность такова, что российская геральдика, особенно родовая и личная, держится в основном на энтузиазме геральдистов, поэтому я довольно пессимистически оцениваю перспективы создания с помощью ИИ даже одной локализованной базы данных, включающей в себя большинство известных российских гербов.
Александр Николаевич ХМЕЛЕВСКИЙ, главный редактор веб проекта Гербовник.ру Приступая к обсуждению этой весьма интересной, безусловно, своевременной и, в тоже время, несколько необычной для специалистов в такой сугубо гуманитарной отрасли исторической науки, как геральдика, теме, хотел бы в первых строках категорически заявить, что лично мне ничего не известно о сложностях построения баз данных по российской родовой и территориальной геральдике, как и по любой другой геральдике вообще. Это обычная задача по созданию специализированной информационно поисковой системы, решение которой предполагает лишь определенные профессиональные усилия инженерно технического характера.
В чем действительно мне видится сложность этого проекта это в его организационном обеспечении. Успешная его реализация возможна лишь при наличии создании мотивированной инициативной группы, которая должна включать в себя 1специалистов, обладающих одновременно профессиональными компетенциями в таких отраслях знаний, как а геральдика, б информационно поисковые системы, в распознавание образов и нейросети. Таковых в одном лице, вероятно, вообще не существует, поэтому необходимы специалисты, сочетающие как минимум компетенции а +б или а +в
2 энтузиастов, способных донести или разъяснить, или убедить специалистов архивного и музейного дела в значимости проекта и важности формирования его информационных ресурсов за счет фондов вверенных им учреждений
3 лиц, либо располагающих свободными финансовыми средствами, либо способных привлечь инвестиции в объеме, обеспечивающих финансирование проекта, в т развертывание и эксплуатацию комплекса технических средств, оплату труда разработчиков, призванных осуществить реализацию программного обеспечения проекта, технических работников, которые будут обеспечивать ввод геральдических данных в систему тем или иным путем сканирование, формализация блазонов и т а также иные различные затраты.
Образование подобной реально действующей т не занимающейся маниловщиной и прожектерством группы представляется автору этих строк полной утопией. Однако, во имя этого короткого слова почти предлагается немного поразмышлять над тем, какие варианты инженерного решения системы подобного рода могут существовать.
Как представляется, реализация системы подобного рода может иметь несколько вариантов от простых до достаточно сложных. Эти варианты и могут стать этапами создания системы.
Наиболее простым вариантом реализации видится формирование полнотекстовой коллекции описаний гербов блазонов и массива изображений гербов. Под описаниями здесь понимаются официальные и иные тексты из гербовников, дипломов, законодательных актов и специализированных публикаций, не подвергаемые на этом этапе и это важно никакой формализующей обработке. Такого рода описания будем называть аутентичными блазонами. Массив изображений формируется путем сканирования где возможно или фотографирования как изображений из кодифицирующих источников гербовников, дипломов, законодательных актов и т так и изображений на бытовых артефактах, экслибрисах, надгробиях и т
Прототипом подобного рода системы может служить популярный у российских геральдистов сайт Гербовник.ру наполнение которого, к сожалению, неполно как в силу ограниченности ресурсов по его сопровождению, так и доступа к первоисточникам.
Такого рода система при всей простоте и даже примитивности ее построения может позволить осуществлять поиск по текстам аутентичных блазонов. Практика применения подобного поиска даже на сайте Гербовник.ру где используется маловыразительный язык запросов в сочетании с возможностью визуального анализа изображений гербов, формально релевантных запросу а именно для этого и нужен вышеупомянутый массив изображений показывает, что даже такой простейший подход к задаче идентификации гербов зачастую приводит к успешным результатам.
Следующий возможный этап развития системы это реализация поиска по накопленному массиву изображений. Даже простейший его вариант а говоря о начальных этапах реализации, мы обсуждаем именно простые варианты предполагает применение т сBIR технологий сontent based image retrieval и, соотв., привлечение к проекту специалистов по таким технологиям. При всей нетривиальности математического аппарата решения этой задачи, в настоящее время существует большое количество готовых инструментальных средств разной степени сложности и соответственно стоимости позволяющих решить задачу поиска релевантных изображений гербов без привлечения на этом этапе технологий распознавания образов и искусственного интеллекта. Есть изображение герба, требующее идентификации и система находит аналогичное в накопленном массиве изображений. Поэтому чем больше вариантов изображений, помимо официально утвержденных будет накоплено в системе тем больше вероятность успеха простого сBIR поиска. В сочетании с вышеописанной реализацией полнотекстового поиска по аутентичным блазонам вероятность успешной идентификации полноценного изображения исследуемого герба составит порядка 80 90
Однако основным целевым назначением системы такого типа останется решение задачи идентификации гербов важной, популярной и необходимой, но не единственной.
Для решения широкого спектра как исследовательских, так и учетных задач в отношении всего корпуса российских гербов а таковыми навскидку видятся задачи тематического, статистического, стилистического по особенностям изображений источниковедческого и иных видов анализа, поиска и идентификации по нечетким и или фрагментарным изображениям и многие другие необходима, разумеется, разработка полноценной информационно аналитической поисковой системы ИПС
Классическим начальным этапом создания любой ИПС является семантическое моделирование автоматизируемой предметной области с целью выявления т объектов интереса, их свойств и типов отношений связей между ними. При сугубо поверхностном в рамках данной публикации анализе предметной области нашей гипотетической геральдической ИПС просматривается достаточно простая структура это два основных объекта 1герб как юридический и или исторический артефакт и 2 изображение герба.
Объекты 1го типа характеризуются такими свойствами, как фамилия рода или название населенного пункта территориального объекта к которому относится герб, сведения об утверждении принятии герба даты, документы, места их хранения и т сведения о бытовании герба и прочее. Объекты 2 го типа характеризуются собственно изображением, аутентичным блазоном при наличии сведениями об источнике изображения архивные или музейные номера, даты, географические локации и пр. а также т формализованным блазоном, который подробно обсудим ниже по тексту. Эти два типа объектов связаны между собой отношением типа один ко многим которое можно назвать Изображение относится к гербу
Модель именно такой структуры реализована в базе данных сайта Гербовник.ру разумеется, в сильно урезанном виде, как минимум не предполагающем хранение сведений по территориальным гербам. Однако даже в таком сокращенном и не до конца продуманном виде она доказала свою применимость для хранения и поиска информации о геральдических объектах.
Выше я осторожно коснулся темы формализации блазонов и пришла пора подробно обсудить этот сюжет, как основную краеугольную основу всей системы.
Так уж сложилось и чрезвычайно повезло всем геральдистам что за века практического блазонирования, от рыцарских турниров до жалованных дипломов и законодательных актов, сложилась четкая однозначная структура описания блазона герба, независящая от вербальных реализаций этих блазонов, будь то четкие и лаконичные французские и английские блазоны, или весьма многословные в германоязычных и славяноязычных в широком смысле польской, русской, чешской и т геральдических системах. Наряду с четкой структурой блазонов также сложился обширный набор четких и практически однозначно трактуемых терминов, в том числе, хотя и во многом заимствованных, в русской геральдике. Этот терминологический набор причем, возможно, на многих языках по сути, образует полноценный тезаурус нашей гипотетической ИПС.
Самое же главное и полезное свойство, с точки зрения автора этих строк, сложившейся четкой структуры блазонов состоит в том, что она структура поддается формализованному описанию как контекстно свободная грамматика а, следовательно, на ее основе может быть описан формальный регулярный язык, выражения которого могут быть построены с помощью конечного автомата, который, разумеется, может иметь программную реализацию.
Практическое значение этого факта состоит в возможности разработки программного инструмента, который будет создавать формализованное описание любого замечу не только русского герба в некоторой единой нотации, которую предстоит разработать.
При этом для данной нотации не будут иметь значения способ передачи цвета герба в исходном изображении красками или штриховкой, а равно использование устаревшей или современной терминологии в аутентичных блазонах.
Самое замечательное состоит в том, что в той же самой нотации может строиться формализованное описание идентифицируемого определяемого герба в объеме, определяемом фрагментарностью, читаемостью и сохранностью его изображения. В этом случае идентификация герба сводится к весьма простой задаче поиска хранимого формального блазона, максимально релевантного искомому. При небольшом программистском усилии легко обеспечивается групповой поиск или поиск по зеркально описанным блазонам.
Реализация этой идеи предполагает решение двух важных задач 1определение нотации формализованных блазонов это очень важный вопрос, так как перестроение всего накопленного массива формализованных блазонов в новой нотации, если кому то это представится необходимым, будет являться весьма и весьма ресурсоемкой процедурой 2 определение методологии и технологии построения генерации формализованных блазонов.
По первому пункту автору видятся как минимум два варианта для обсуждения предлагаемый коллегой А Грефенштейном подход, основанный на использовании т формульного описания, сводимого, по сути, к построению векторов признаков элементов герба, и подход, предлагаемый автором, основанный на использовании методики, применяемой в общеизвестных и популярных языках текстовой разметки XML, JSON и проч. а именно, тегирования снабжения тегами маркерами по определенным правилам основанным на вышеупомянутой КС грамматике элементов герба с той или иной экспертно определяемой степенью детализации.
По второму пункту объективно существуют два основных подхода
2. 1Ручной ввод формализованных описаний с помощью специальной программы мастера формализации блазонов такого рода программы часто называют термином Wizard В этом случае оператор ввода должен быть геральдическим экспертом высокого уровня как минимум, экспертом в практическом блазонировании так как программа мастер обеспечит ввод требуемых описаний всех элементов герба в нужном объеме и последовательности, но решения о структуре разбиения щита, названиях фигур в щите, их тинктурах и названиях атрибутов фигур какой лев вздыбленный, шествующий, стоящий, оборачивающийся и т остаются ответственностью эксперта. Разумеется, программа будет предлагать для выбора всегда только допустимые контекстно зависимые термины, но полностью исключить элемент экспертной субъективности нельзя. А от качества и единообразия формальных блазонов будет очень зависеть в последующем качество поиска.
Оценим крайне приблизительно время на ручную обработку предполагаемого массива около 7 тысяч родовых как утвержденных, так и самобытных, включая остзейские, малороссийские, белорус ские, финляндские и т и свыше 7 тысяч территориальных, включая гербы, утвержденные в Российской империи, советские гербоиды и современные гербоподобные эмблемы. Если эксперт, приобретя навыки и опыт работы с программой мастером формализации блазона, будет затрачивать 6 минут на герб т 10 гербов в час, около 70 гербов за рабочий день то обработка 14 тысяч гербов займет, соответственно, 200 рабочих дней, т около 10 месяцев. Для двух экспертов соответственно 5 месяцев, но в этом случае вероятность терминологических расхождений еще более возрастает.
2.2 Поэтому мы неизбежно приходим в наших мечтах о специализированной геральдической ИПС к вопросу может ли искусственный интеллект помочь в этом на данном этапе Вот как раз на этом да, может. И достаточно эффективно Не утомляя читателя еще более наукоемкими рассуждениями, тем не менее, необходимо отметить следующее требуется непростое и весьма специализированное программное решение класса распознавания образов, которое обеспечит единообразное в отличие от живого эксперта распознавание структуры герба, его элементов и их тинктур. Специально обученная нейросеть сможет правильно атрибутировать элементы фигуры герба вздыбленный лев ВСЕГДА будет вздыбленным хотя нельзя забывать о проблеме подготовки репрезентативной выборки для обучения этой нейросети.
Исходя из вышеназванных объемов, указанные 14 тысяч гербовых изображений могут быть обработаны менее чем за 5 суток при достаточно медленной будем пессимистами скорости обработки 30 секунд на изображение. При большей эффективности алгоритма распознавания и генерации блазона время будет соответственно сокращаться.
Автоматическая генерация точнее автоматизированная, так как, увы, всегда будет небольшой процент изображений гербов полноценное распознавание и формализация которых потребуют участия эксперта может выполняться не только для основных эталонных изображений, но и для всех прочих артефактных, самобытных и т кроме того, при наличии такого рода генератора нет причин ограничиваться только российскими гербами.
Очень важно также и то, что формализованное описание искомого т идентифицируемого герба может точнее должно строится с использованием того же самого ИИ алгоритма. В этом случае близкий к 100 поисковый успех будет обеспечен.
В заключение своего экскурса в геральдические Нью Васюки хотел бы повторить тезис, с которого начал во всем вышеописанном нет ничего принципиально нового за исключением самой предметной области и нереализуемого с точки зрения современных информационных технологий. Есть комплекс инженерных задач, зачастую весьма нетривиальных, требующих вдумчивого профессионального решения при наличии научной и политической воли геральдического сообщества и соответствующих финансовых возможностей.
Сост. И Афонасенко.
Текст поступил в редакцию 15 декабря 2023 г.