Silicon Taiga: Смышленая паутина

«Сегодняшние поисковые системы зачастую выдают бесчисленное множество совершенно не относящихся к запросу документов, обрекая пользователя на длительный ручной отбор материала. Например, если вы ввели для поиска понятие „cook“, то компьютеру совершенно неясно, имеете ли вы в виду профессию повара, хотите ли найти информацию о рецептах приготовления пищи, или же вам нужен какой-то человек, местность или компания, в чьем имени или названии встречается слово „cook“. Вся проблема в том, что для компьютера это слово не имеет четкого смысла, или, другими словами, семантического содержания». («The Semantic Web». Tim Berners-Lee, James Hendler, Ora Lassila. «Scientific American», May 17, 2001.)

Все бесконечное непознаваемо, говорили древние, еще и не подозревая о том, какую сферу приложения этой мудрости придумают их потомки на исходе второго тысячелетия новой эры. Зародившаяся в 80-х годах ХХ века идея глобальной информационной сети, опираясь на организационно-методический фундамент технологий World Wide Web, реализовалась в виде сегодняшнего Интернета, масштабы которого ни измерить, ни ограничить уже не представляется возможным. Современное киберпространство ширится и развивается совершенно фантастическими темпами, постоянно пополняясь новыми и новыми разнообразными формированиями и неисчерпаемыми сведениями, относящимися ко всем без исключения отраслям и аспектам жизнедеятельности общества. И, к сожалению, те времена, когда это безостановочное развитие приносило сетевой аудитории одно лишь удовлетворение от прирастания собственного информационного могущества, чрезвычайно быстро миновали. Предназначенное в конечном счете для практического использования содержание веб-ресурсов вышло за рамки обозримости и операбельности, а задача исследования и обработки массивов рассредоточенных по Сети данных стала превращаться из естественной составляющей нормального информационного процесса в сверхсложную, а то и вовсе неразрешимую проблему.

«Интернет - самая гигантская из когда-либо существовавших баз данных, - констатирует директор американской компании eWeek Labs Джим Рапоза, профессионально связанный со Всемирной паутиной уже более 15 лет. - Ее содержание охватывает все дисциплины, языки и области знаний, однако работать с ней день ото дня все труднее. Традиционные поисковые системы, призванные помочь вам в нахождении необходимого материала, изо всех сил стараются выполнить эту важную миссию и зачастую в ответ на ваши запросы предлагают массу ссылок на документы, действительно включающие указанные вами слова и даже их сочетания. Беда только в том, что большая часть этих ссылок не имеет, как правило, ничего общего с тем, что вы на самом деле ищете. Ну а если в материалах по интересующей вас теме используется специфическая терминология или отличающийся от запроса язык, ваши изыскания заведомо обречены на неудачу».

Главное - чтобы тебя понимали

«Семантическая Сеть - это не какая-то отдельная сеть, а расширение уже существующей, - причем такое, за счет которого информация снабжается точно определенным смыслом, позволяющим человеку и машине взаимодействовать более успешно и эффективно».
Тим Бернерс-Ли

Можно сколько угодно сетовать на неупорядоченность содержания Интернета, на распыленность нужных вам данных по его территории, на нестабильность их расположения и множество других аналогичных и, несомненно, объективных условий, мешающих продуктивному онлайновому поиску. Но все эти условия - от децентрализованной структуры Сети до перманентной миграции деталей и звеньев ее контента - являются ее врожденными качествами, предопределены априорной свободой и независимостью глобального информационного обмена и никоим образом не относятся к разряду непреодолимых препятствий. Главная же причина нарастающих трудностей навигации в Интернете заключается все-таки не в них, а в первую очередь в том, что все без исключения веб-технологии, сфокусированные на обеспечении информационной деятельности человека, безоговорочно следовали только его, человеческой, точке зрения и логике. Компьютеру в этом деле отводилась предельно статичная роль вычислительного устройства - пусть даже достаточно мощного, но нацеленного исключительно на механический перебор вариантов ответа, подходящих или неподходящих по формальным признакам под условия сделанного человеком запроса.

Принципы обнаружения информации по контексту, заложенные в основу функционирования первоначальных поисковых веб-систем, никакого другого участия машины в обработке сетевых данных и не предусматривали. Да и до сих пор большинство технологий поиска базируется на индексации (закодированном описании) вхождения заданных слов и понятий в совокупность доступных конкретной системе документальных источников. Для сбора сведений о наличии и содержании документов, исходя из которых строятся индексы, применяются программы-роботы, рекурсивно обходящие по ссылкам ресурсы Интернета. При этом сам подход к формулировке задачи для компьютерного поиска обусловливает поверхностный характер этой операции и не позволяет получить ответ на целый ряд чрезвычайно важных вопросов: как расставлять приоритеты при исследовании тех или иных ресурсов Сети, каким образом осуществлять выбор объектов индексирования, какими критериями надо руководствоваться при окончательной селекции найденного материала и выдаче его пользователю в качестве результатов исследовательской работы компьютера.

Даже после того как современные поисковые системы были обучены сопоставлению связующих веб-страницы ссылок и преобразованию ключевых слов запроса в некоторые понятия, фундаментальная проблема ориентации человека в интернет-пространстве так и не была решена. Задачи смыслового анализа данных, их сравнения и интеграции оставались для автоматизированного веб-поиска непосильными. И прежде всего потому, что постановщики этих задач привыкли рассматривать компьютер всего лишь как высокопроизводительный электронно-счетный механизм, забывая о его возможности выносить суждения и делать заключения. Ну а при таком отношении рассчитывать на активную помощь со стороны машины тоже не приходилось: для проведения операций на качественно новом для себя логическом уровне ей нужно было подняться на качественно иную ступень взаимоотношений и взаимопонимания с человеком, но при отсутствии общего с ним языка сделать это было невозможно. И если уж человек начал проявлять заинтересованность в привлечении компьютера к более скрупулезной и детальной обработке веб-информации, то он и должен был первым пойти навстречу машине, приложив дополнительные усилия к тому, чтобы его общение с ней стало взаимоприемлемым, обоюдоясным и не допускающим разночтений или неверных толкований. Иначе говоря, возникла настоятельная потребность в разработке таких способов диалога человека и компьютера, при которых содержание информационных материалов и поисковых запросов представлялось бы в формате, пригодном для достаточно глубокого машинно-семантического анализа.

Трактование слов

«Главная задача Семантической Сети - создать язык, на котором можно будет описывать как данные, так и принципы трактования этих данных таким образом, чтобы правила выводов, существующие в какой-либо одной системе представления знаний, передавались по Сети другим подобным системам».
Тим Бернерс-Ли

К осознанию этой потребности наиболее дальновидные теоретики и практики развития World Wide Web пришли довольно давно. Еще в 1994 г. президент корпорации SoftQuad Inc. и видный идеолог эпохи становления Интернета Юрий Рубинский доказал необходимость и неизбежность создания системы семантических метаданных. Уже через год подобные обоснования и предложения приобрели массовый характер и реализовались в конкретном интернациональном проекте - открытом форуме программистов, названном «Инициатива по разработке метаданных дублинского ядра» (Dublin Core Metadata Initiative, DCMI), участникам которого удалось сформировать весьма экономичный, простой в использовании, базирующийся на HTML и при этом совместимый с другими веб-языками набор метаданных, применимых для семантического исследования содержания сетевых ресурсов. А в 1998 году, выступая на 8-й ежегодной международной конференции World Wide Web в Торонто, отец-основатель Всемирной паутины Тим Бернерс-Ли изложил новое видение завтрашнего дня Интернета, заявив, что в отличие от нынешних принципов его организации, в соответствии с которыми люди обмениваются информацией при помощи документов, перспектива его развития должна предусматривать совместную работу пользователей и программно-аппаратных веб-систем на базе технологий смысловой интерпретации данных.

Таким образом была впервые сформулирована идея Semantic Web - семантического расширения существующей Сети, благодаря которому содержащиеся в ней сведения можно будет представлять не только в виде совокупности слов как буквосочетаний, но и оперируя их существом, значением и смыслом. Концепция Бернерса-Ли и его коллег из возглавляемого им консорциума World Wide Web (W3C) настолько же проста, насколько и революционна: она состоит в том, чтобы сделать-таки первый шаг в направлении интеллектуализации веб-систем и создать общую универсально-языковую структуру, в которой каждой «человеческой» единице информации сопутствовала бы соответствующая единица информации машинной - отдельный смысловой тег.

Весной 2001 г. инициаторы концепции Semantic Web впервые подробно описали ее широкой общественности. К тому времени замысел уже превратился в серию проработанных проектов, над выполнением которых трудились специально учрежденные рабочие группы W3C, и глава консорциума в соавторстве с другими ведущими его специалистами опубликовал в авторитетном и популярном журнале «Scientific American» программную статью, посвященную стратегии развития Семантической Сети и преимуществам создаваемого на ее основе веб-контента. «До сегодняшнего дня всемирная компьютерная сеть наиболее быстро развивалась как носитель документов, используемых людьми, а не как хранилище информации, допускающей ее автоматизированную обработку, - говорилось в этом трактате. - Снабдив веб-страницы некоторым количеством компьютерно-ориентированных данных, а также создав документы, доступные для машинного исследования, мы тем самым превратим эту привычную сеть в семантическую. В результате компьютеры смогут „понимать“ смысл содержащихся в ней данных, следуя гиперссылкам, ведущим к определениям ключевых терминов и правилам логических рассуждений о них. Выстроенная таким образом инфраструктура станет отправной точкой для разработки высокоэффективных поисковых программ-агентов и других веб-служб электронной обработки контента».

Агенты особого назначения

«Семантическая Сеть привнесет структуру в смысловое содержание веб-страниц, тем самым создав среду, в которой программные агенты, переходя со страницы на страницу, смогут без особого труда выполнять замысловатые запросы пользователей».
Тим Бернерс-Ли

Апологеты Semantic Web вполне осознанно не торопились с вынесением своих планов на всеобщее обсуждение: к моменту появления статьи в «Scientific American» у них уже была возможность предъявить массовой аудитории не столько общие рассуждения и теоретические выкладки в связи с сооружением «умной паутины», сколько вполне реальные примеры методов и алгоритмов использования метаданных и других элементов семантического информационного пространства.

Едва ли не первым образцом специализированного инструментария, предназначенного для работы в Семантической Сети, явился язык XML (еХtensible Markup Language), отнесенный в итоговом рейтинге компании IDG за 2001 г. к числу главных технологических достижений, способных изменить в ближайшие годы весь компьютерный мир. Если в арсенале «традиционных» веб-технологий наиболее признанным и распространенным считался язык HTML, базирующийся на принципах стандартного ASCII-кодирования и ориентированный на формальную разметку текста без учета его смысловых характеристик, то XML представляет собой метаязык, превосходящий привычный HTML по гибкости и универсальности и предназначенный не только для форматирования данных в Интернете, но и для распознавания семантического значения этих данных. Исходная версия спецификации XML, разработанная в консорциуме W3C под руководством Джона Босака, была выпущена в свет в феврале 1998 г. и с тех пор выросла до масштабов платформы, позволяющей объединять разрозненные языковые диалекты и создавать новые языки разметки, учитывающие специфику документов заданной предметной области (к примеру, MathML, XLink, SMIL, XSL и др.).

Второй секцией фундамента Semantic Web может считаться методологическая модель Resource Description Framework (RDF), назначение которой состоит в описании отношений между сетевыми ресурсами и информацией. Принцип построения этих отношений в спецификации RDF предельно упрощен и предусматривает наличие трех компонентов - объекта, атрибута и значения, сочетание которых напоминает классическую грамматическую схему «подлежащее - сказуемое - дополнение». В таких выражениях, как «Москва является столицей России» или «В 1945 году окончилась Вторая мировая война» «Москва» и «Вторая мировая война» будут рассматриваться в качестве объектов (подлежащих), атрибутами которых выступают понятия «является столицей» и «окончилась» (сказуемые), а значениями атрибутов (дополнениями) станут «Россия» и «в 1945 году». Каждому элементу подобной трехзвенной цепи присваивается унифицированный идентификатор (URI), благодаря которому в дальнейшем при указании одного из звеньев можно будет автоматически восстановить всю цепочку в целом.

Несмотря на всю примитивность приведенных примеров, они все-таки дают некое общее представление о логике действий программ-агентов, которым надлежит обрабатывать запросы по методике RDF, - равно как и о том, что «интеллектуальный уровень» этих агентов может оказаться недостаточно высоким для выполнения более сложных заданий. Для оказания им помощи и поддержки в структуре Semantic Web должны присутствовать онтологии - универсальные базы знаний, предоставляющие сведения для отождествления новых слов с уже знакомыми, для определения принадлежности используемых терминов к той или иной предметной области и, в конце концов, для приведения любых понятий к виду, пригодному для восприятия электронными агентами. Исследователи и разработчики сетевых процессов из разных стран и организаций уже не однажды предпринимали попытки формализации онтологий, завершавшиеся, в частности, и созданием «онтологических языков». Два из них - Ontology Inference Layer (OIL) и DARPA Agent Markup Language (DAML) - стали базовыми при построении языка Web Ontology Language (OWL), предназначенного программистами W3C специально для использования в Семантической Сети. Главная функция OWL состоит в формулировке межпонятийных взаимосвязей, посредством которых, собственно, и определяется соответствие хранящихся в Сети RDF-описаний пользовательским запросам.

Атрибуты интеллекта

Определение World Wide Web Consortium: Semantic Web представляет собой систему расширения существующей глобальной сети, с помощью которой информация представляется в четком и определенном смысловом значении, дающем возможность людям и компьютерам работать с более высокой степенью взаимопонимания и согласованности.

Условия представления знаний в Semantic Web:

Универсальные выразительные возможности. Поскольку нельзя учесть интересы всех потенциальных пользователей, формат обмена на базе Web должен позволять представлять любой вид данных.

Синтаксическая интероперабельность. Программы должны иметь возможность читать данные и получать представления, с которыми они могут работать. Уровень синтаксической интероперабельности в достаточной мере высок, когда можно без труда получить синтаксический анализатор и интерфейсы прикладных программ (API), необходимые для манипулирования данными.

Семантическая интероперабельность. Одно из наиболее важных требований к формату обмена состоит в том, что данные должны быть понятными. Если синтаксическая интероперабельность неразрывна с синтаксическим разбором данных, то семантическая связана с установлением соответствия между терминами, используемыми в данных, что требует анализа содержимого.
Источники: «OWL Web Ontology Language Semantics and Abstract Syntax» (W3C Recommendations, February 10, 2004); «Resource Description Framework - механизм описания ресурсов в Semantic Web» (П. Михеев, издательство «Optim.ru» - серия «Технология Клиент-Сервер 2003»); «The Semantic Web: The Roles of XML and RDF» (S. Decker, S. Melnik, F. Van Harmelen, D. Fensel, M. Klein, J. Broekstra, M. Erdmann, I. Horrocks - Internet Computing, 2000).

Долгий путь в лабиринте

«В полную силу Семантическая Сеть заработает тогда, когда люди создадут множество программ, которые, знакомясь с содержимым Сети из различных источников, смогут обрабатывать полученную информацию и обмениваться результатами с другими программами».
Тим Бернерс-Ли

Однако и при наличии комплекса основополагающих средств и механизмов функционирования Semantic Web и безусловного внимания всего интернет-сообщества к ее настоящему и будущему, вопрос о начале ее активной работы отнюдь не считается решенным. Ведь даже если речь идет об одной-единственной прикладной программе, то от ее написания до фактического применения лежит дистанция немалого размера, проходящая через многочисленные тестирования и доработки, согласования и адаптации. Что уж тут говорить о целой программной системе, задуманной к тому же для того, чтобы перевернуть общие представления о глобальной сети и взаимоотношениях человека с компьютером. Именно поэтому многоопытные профессионалы из W3C, хорошо представляющие себе объем работ, который еще надлежит выполнить для доведения новых технологий до состояния эксплуатационной готовности, и длину лабиринта, который им предстоит пройти в целях стандартизации и апробации своей системы во всех заинтересованных учреждениях и компаниях, не спешат и с какими бы то ни было заявлениями по поводу возможных сроков наступления «эпохи технологической интеллектуализации» Всемирной паутины. По той же причине большинство ИТ-экспертов, прекрасно осведомленных о том, сколь невелик процент многообещающих идей, которые оказываются способными преодолеть весь тернистый путь от появления на свет до практической реализации, склоняется к тому, чтобы считать годом рождения Семантической Сети не 1998-й и не 2001-й со всеми провозглашенными и растиражированными тогда декларациями, а только прошлый, 2004-й.

Во вторник, 10 февраля 2004 г. World Wide Web Consortium опубликовал в качестве своих официальных рекомендаций ключевые компоненты проекта Semantic Web, включающие описание модели Resource Definition Framework и языка Web Ontology Language. При всей продуманности политики W3C в отношении этого проекта и осторожности руководства консорциума, дальше тянуть с изданием первых результатов проделанной работы было уже нельзя: волна критики в адрес инициаторов строительства Семантической Сети достигла опасного предела. За длительный период ожидания базовых версий нового технологического комплекса некоторые сторонники проекта успели переметнуться в стан его противников и, уподобляя Semantic Web ранее провалившимся идеям создания искусственного интеллекта, принялись обвинять лидеров W3C в отвлечении сил и финансов от более важных и актуальных процессов развития «обычных» веб-технологий. Тем не менее, преданных приверженцев у Семантической Сети осталось достаточно много, и в ответ на эти претензии они обращали всеобщее внимание на то, что за последнее время консорциум заметно интенсифицировал разработку программных элементов Semantic Web, ориентируя этот проект на сооружение инфраструктуры высокого уровня и коммерческого назначения для обеспечения эффективного обмена данными через Интернет.

«Семантическая Сеть уже переросла границы исследовательского проекта, - заявила в своем интервью после февральской публикации представительница W3C Джанет Дейли. - Две его основополагающие технологии становятся стандартами, а крупные участники ИТ-индустрии внедряют RDF и OWL в прикладные программы корпоративного уровня, так что он вполне готов к широкому применению». Привлечение к дальнейшей разработке, тестированию и использованию элементов Semantic Web как можно более широкого круга заинтересованных профессиональных организаций, промышленных компаний и независимых энтузиастов и в самом деле является сейчас наиважнейшей задачей для авторов проекта. Интероперабельность - неотъемлемое и обязательное свойство Семантической Сети, а потому среди основных аспектов ее успешного продвижения сегодня значится и размещение имеющихся онтологий для свободного доступа в Интернете, и стандартизация уже апробированных онтологий, и соотнесение понятий разных онтологий посредством языка OWL, и формирование общеупотребимой терминологии запросов, адресуемых RDF-хранилищам, и множество других вопросов и проблем.

«Желательно, чтобы поставщики систем управления контентом как можно раньше начали предоставлять пользователям возможность размечать данные для адаптации к Semantic Web, - высказывает свое мнение уже упоминавшийся выше Джим Рапоза. - Я надеюсь, что инструментами Семантической Сети своевременно начнут пользоваться наиболее влиятельные сайты - такие, как Yahoo.com, и это станет примером для других. Не стоит забывать, что в дни своей юности весь Интернет рос крайне медленно. В 1995 г. я, например, слышал от многих бизнесменов, что для них и их корпораций от Всемирной паутины нет и не может быть никакой пользы».

Технологические компоненты Semantic Web
Определение	Назначение	Принципы работы	Сферы использования
Расширяемый язык разметки eXtensible Markup Language (XML) - спецификация, позволяющая определить синтаксис и структуру документов.	В отличие от языка HTML, создававшегося для гипертекстовых документов с фиксированной структурой, XML предназначен для разметки документов произвольной структуры.	Корректным образом составленные XML-документы содержат сбалансированное дерево вложенных открывающих и закрывающих тегов, каждый из которых может включать в себя несколько пар «атрибут - значение». Поскольку фиксированного словаря тегов, равно как и набора их допустимых комбинаций, не существует, теги могут определяться независимо для каждой программы. В XML это делается с помощью определения типа документа DTD (document type definition), накладывающего ограничения на используемые теги и указывающего, каким образом должна быть организована их вложенность внутри документа. DTD задает грамматику, которая указывает допустимые комбинации и вложения имен тегов, имен атрибутов и так далее.	XML соответствует требованию об универсальных выразительных возможностях, поскольку все, для чего можно определить грамматику, можно закодировать в XML. Он также удовлетворяет требованию синтаксической интероперабельности, однако задачу обеспечения семантической интероперабельности с помощью XML решить невозможно.
Система онтологий и соответствующий ей язык сетевых онтологий Web Ontology Language (ОWL), предназначенные для определения терминов и отношений между ними.	Онтология - термин, заимствованный из философии, который обозначает науку, описывающую формы бытия и то, как они относятся между собой. Web-онтология может включать описания классов, свойств и их примеры. Язык веб-онтологий OWL - это язык для определения и представления веб-онтологий. Формальная семантика OWL описывает, как получить логические следствия, имея такую онтологию, т. е. получить факты, которые не представлены в онтологии буквально, но следуют из ее семантики. Эти следствия могут быть основаны на одном документе или множестве распределенных документов, которые комбинируются с использованием определенных механизмов OWL.	Поскольку Семантическая Сеть по определению распределена, OWL должен позволять собирать информацию из распределенных источников. Это частично обеспечивается возможностью онтологий быть связанными, включая прямой импорт информации из других онтологий. В дополнение, OWL предполагает открытость. То есть описания ресурсов не ограничены единственным файлом или темой. При этом новая информация не может опровергать предыдущую информацию. Новая информация может быть противоречащей, но факты и следствия могут только добавляться и не могут удаляться. Разработчик онтологии должен учитывать возможность таких противоречий. Ожидается, что инструменты, поддерживающие OWL, помогут обнаруживать такие случаи. Чтобы написать онтологию, которая может однозначно интерпретироваться и использоваться программными агентами, необходимы синтаксис и формальная семантика OWL.	Онтологии используются для поддержки автоматизированного обмена данными и для интеграции программ. Механизмы поиска также применяют онтологии для выборки страниц с синтаксически различными, но семантически одинаковыми словами.
Система описания ресурсов Resource Description Framework (RDF), обеспечивающая модель кодирования для значений, определенных в онтологии.	Механизм RDF предназначен для стандартизации определений и использования метаданных, описывающих ресурсы Web, а также для представления самих данных, содержащихся в этих ресурсах.	В основе методики RDF лежит аппарат утверждений. Описание ресурса в RDF - это совокупность утверждений о свойствах ресурса. Каждое утверждение представляет собой именованное отношение между описываемым ресурсом и значением свойства. Значение может быть как литеральным значением, так и другим ресурсом. Именованное отношение представляет собой имя, сопоставленное свойству ресурсов. Примечательной стороной RDF является то, что она позволяет делать утверждения не только о ресурсах, но и о самих утверждениях. Информационный ресурс описывается с помощью той или иной совокупности терминов (понятий) - словаря терминов. Семантика, смысл самих терминов и словарей терминов, фиксируется с помощью некоторых глобальных универсальных имен - URI (Uniform Resource Identifier). Словарь терминов, называемый RDF-схемой, определяет, какие термины могут быть использованы в RDF-утверждениях о свойствах ресурсов, представляет иерархию понятий (терминов) предметной области, описывает важные характеристики каждого понятия.	RDF является XML-программой, которая применяется для описания ресурсов без каких бы то ни было предположений относительно специфики предметной области, но с максимальным удобством описания и обработки сведений о любой области. Согласно архитектуре WWW, RDF представляет собой связующее звено между XML-документами и высокоуровневыми средствами, обеспечивающими поиск и навигацию на основе логических утверждений.

Сказку сделать былью

«Правильно организованная Семантическая Cеть может способствовать эволюции всего человеческого знания в целом».
Тим Бернерс-Ли

«Семантическая Сеть - это действительно горячая тема, и интерес к ней постоянно возрастает, - продолжает предыдущую мысль известный специалист в области веб-технологий доктор Стюарт Фельдман. - Нет никаких признаков, что эта идея может утратить свою актуальность. Вполне разумно было бы предположить, что Semantic Web является воплощением мечты об искусственном интеллекте. Но разработчики и сторонники проекта стараются избегать этого понятия - уж слишком сложно складывается его судьба и слишком много отрицательных эмоций оно вызывает». Говоря об отрицательных эмоциях, д-р Фельдман, скорее всего, имел в виду тот скепсис, который воцарился в среде экспертов и аналитиков высокотехнологичных отраслей после серии неудачных попыток «интеллектуализации» электронных устройств самого разного типа и назначения. Но скепсис скепсисом, а разговоры о Семантической Сети спровоцировали новый всплеск воодушевления горизонтами развития взаимоотношений человека и окружающей его техники. Интернет стал уже привычной частью сегодняшнего быта, и наделение его дополнительными средствами обеспечения осмысленного диалога людей с компьютерами кажется вовсе не сказкой, а вполне осуществимым планом завтрашнего дня.

Ведь и вправду: RDF-идентификаторы могут содержать ссылки не только на веб-страницы, но и на определенные физические объекты, к числу которых без особой фантазии можно отнести всю домашнюю электронную аппаратуру. Тогда программные «агенты влияния» Semantic Web возьмутся за регулирование телевизоров и холодильников, автомобилей и утюгов. Будучи гораздо более гибкой и эффективной в сравнении со схемами более низкого уровня - вроде Universal Plug and Play, - Семантическая Сеть сможет выйти из пределов виртуальной области, расширить сферу своего влияния на материальный мир и существенно увеличить возможности человека по управлению им.

«Онлайновые каталоги, снабженные семантической разметкой, принесут немалую пользу как покупателям, так и продавцам. В сфере малого бизнеса станет гораздо проще налаживать проведение транзакций в области электронной коммерции, имеющих большую степень защиты и автоматизации, - конкретизирует перспективы Semantic Web Тим Бернерс-Ли. - Допустим, вы заранее бронируете места с целью совершения длительной зарубежной поездки. Аэропорты, гостиницы, футбольные стадионы и проч. подтверждают бронирование требуемых мест, пользуясь семантической разметкой. После этого расписание всех намеченных событий и поездок загружается в ваш ежедневник, а все планируемые расходы - в программу, управляющую вашим счетом, причем совершенно не имеет значения, какое семантически настроенное программное обеспечение вами используется. Больше не нужно сидеть за утомительным занятием перенесения нужной информации из электронных писем. Больше не требуется для различных видов деятельности пользоваться полудюжиной различных форматов данных или, более того, для каждого нового вида деятельности самому разрабатывать и внедрять новые форматы».

Semantic Web: первый год официальной биографии

15 января 2004 г. - World Wide Web Consortium (W3C) издает в качестве своих рекомендаций описание первой версии системы Composite Capability/Preference Profiles 1.0 (CC/PP), описывающей порядок взаимодействия пользователей Семантической Сети и электронных устройств при обработке веб-контента с помощью программных механизмов Resource Description Framework (RDF).

10 февраля 2004 г. - Консорциум W3C публикует ключевые компоненты глобального проекта Semantic Web: рекомендации RDF и Web Ontology Language (OWL). Многие эксперты, ИТ-профессионалы и представители пользовательской интернет-аудитории призывают отныне считать эту дату официальным днем рождения Семантической Сети.

2 марта 2004 г. - Руководство W3C объявляет о начале второй стадии осуществления проекта Semantic Web. Этот этап открывается учреждением двух новых рабочих групп консорциума: по вопросам распространения передового опыта и внедрения результатов разработок (Best Practices and Deployment Working Group) и совершенствования доступа к данным с помощью системы RDF (RDF Data Access Working Group).

22 апреля 2004 г. - В Амстердаме проходит первая очная конференция участников рабочей группы W3С RDF Data Access Working Group.

19 мая 2004 г. - Обсуждение перспектив и направлений развития Семантической Сети стало одним из главных вопросов повестки дня открывшейся в Нью-Йорке 13-й ежегодной конференции W3C.

1 июня 2004 г. - В целях популяризации идей Семантической Сети и расширения круга заинтересованных в ее развитии профессиональных и самодеятельных разработчиков в Интернете открываются тематические онлайновые структуры Tack on the Semantic Web и Semantic Web Developers Day, обеспечивающие интерактивное участие пользователей в обсуждении и решении проблем, связанных с различными аспектами проекта Semantic Web.

3 июля 2004 г. - Специальная комиссия консорциума W3C в составе представителей его рабочих групп под руководством и при участии Дэна Бринкли (W3C), Брайана Макбрайда (Нewlett-Рackard), Джима Хендлера (Университет штата Мэриленд) и Гууса Шрейбера (Ibrow) завершила доработку полного рекомендательного пакета из 12 базовых спецификаций Resource Description Framework (RDF) и Web Ontology Language (OWL).

2 августа 2004 г. - Рабочая группа Semantic Web Best Practices and Deployment издала первую версию спецификации значений OWL, состоящую из двух частей: «набор значений» и «распределение значений». В спецификации представлен обширный набор различных элементов языка OWL, причем ее авторы предлагают всем заинтересованным лицам и организациям включаться в процесс доработки и пополнения этого набора.

24 сентября 2004 г. - Завершение разработки директории Ontaria знаменует собой появление первого в истории каталога семантических веб-данных, приспособленного к автоматизированному «пролистыванию», исследованию и поиску. До сих пор технологии Семантической Сети были ориентированы на применение RDF-словарей и OWL-онтологий в условиях, когда все имеющиеся данные формата RDF совершенно ясны и «прозрачны» для пользователя. Работа с RDF-контентом предусматривала необходимость четкого понимания его создателями того, какие словари и каким образом в каждом конкретном случае могут быть употребимы и эффективны. Тем временем принципы построения и эксплуатации Ontaria позволяют использовать его для обработки любого произвольного RDF-контента.

28 октября 2004 г. - Подводя итоги проходившего в Кембридже (штат Массачусетс) симпозиума по проблемам использования Семантической Сети в медицине, биологии и социальном обеспечении, руководство W3C отметило необходимость кардинального усовершенствования, существенного дополнения и взаимной интеграции имеющихся на сегодняшний день терминологических словарей, идентификаторов и веб-ресурсов по всему комплексу наук о жизни, - что, в свою очередь, требует формирования в рамках консорциума особой специализированной рабочей группы.

22 ноября 2004 г. - Выходит в свет еще один комплект документации, посвященной технологиям Семантической Сети. Рекомендации OWL-S: Semantic Markup for Web Services посвящены созданию онтологий и применению языка OWL как элемента веб-служб для автоматизации процессов компоновки, исследования, активизации и мониторинга ресурсов Сети. В рекомендациях дается подробная характеристика структуры онтологий и их основных элементов: «профилей служб», дающих представление о существе и функциях служб; «моделей процессов», в которых содержится детальное описание операций, выполняемых службами; и «основ интероперабельности», определяющих принципы взаимодействия служб между собой.

21 декабря 2004 г. - Рабочая группа RDF Data Access Working Group публикует первые результаты своих работ по адаптации поискового языка SPARQL к формату XML. Использование этого языка в Семантической Сети может значительно облегчить нахождение сведений в таких информационных источниках, как базы персональных данных, электронные системы общественных услуг, а также метаданных в библиотеках аудио-, видеозаписей и графических изображений. Кроме того, SPARQL способен упростить процедуру интеграции разноплановых и несопоставимых по содержанию сетевых ресурсов.

(Источник: «W3C Semantic Web News and Events» - www.w3.org)

Смышленая паутина