Системная социология: Question Answering Systems

Системная социология: Question Answering Systems

А.А.Давыдов

 Системная социология: Question Answering Systems

 Ключевые слова: системная социология, Question Answering Systems

 

Введение

Question Answering Systems (QAS) [1-2] - это компьютерные интеллектуальные автоматические системы для ответов пользователям на естественном языке по широкому кругу вопросов (вопросы Как? Почему? Сколько? факты, определения, гипотезы и т.д.) ( http://en.wikipedia.org/wiki/Question_answering ). В этой связи отметим, что современные Question Answering Systems - это аналитические системы, которые имитируют научное исследование, когда исследователь задает вопрос и в результате проведенного компьютерной системой исследования, пользователь получает ответ.  В мае 2009 г. стартует новая Question Answering System Wolfram Alpha ( http://www.wolframalpha.com ), предназначенная для ответов на разнообразные вопросы пользователей из различных областей знания.

Вместе с тем, несмотря на очевидную научную и практическую пользу, в российской социологии, насколько известно автору, Question Answering Systems не разрабатываются. В этой связи в данной статье автор ставил следующие цели. Во-первых  - привлечь внимание российских социологов к Question Answering Systems, в частности, к Web - Based Question Answering Systems (работающими в режиме онлайн и использующими ресурсы Web) и перспективам их развития. Во-вторых - предложить российским социологам самостоятельно протестировать Wolfram Alpha в области социологии, чтобы затем обменяться мнениями. В третьих, и это самое главное - привлечь внимание российских социологов к разработке Web - Based Question Answering System «Россия», которая была бы способна, на русском языке в режиме онлайн, давать научно обоснованные ответы (решения) на проблемы, стоящие перед современной Россией, прогнозы будущих изменений в России и т.д. на основе базы социологических знаний и данных эмпирических исследований, которые уже собраны в России.

 

Question Answering Systems  

В настоящий момент времени, в режиме онлайн функционируют Web - Based Question Answering Systems на одном или нескольких языках, универсальные и специализированные на какой-либо предметной области (областях). Например, START ( http://start.csail.mit.edu ),   AnswerBus ( http://www.answerbus.com/index.shtml ), NSIR ( http://tangra.si.umich.edu/clair/NSIR/html/nsir.cgi ), Askjeves ( http://www.ask.com ), Lexxe ( http://www.lexxe.com ), LogAnswer ( http://www.loganswer.de ) и т.д. В качестве иллюстрации на рис. 1 представлена  архитектура Question Answering System AQUA ( http://www.aktors.org/technologies/aqua ), функционирующая на основе Natural Language Processing (NLP), Logic и Ontologies.

Рис.1

Архитектура Question Answering System AQUA ( http://www.aktors.org/technologies/aqua )

В 2008 г. был запущен PowerSet ( http://www.powerset.com ),  созданный для ответов на вопросы пользователей, поиска фактов и значений понятий. PowerSet воспринимает ключевые слова, фразы и вопросы, заданные на английском языке, вычленяет их смысл и дает ответ на основе базы данных электронной энциклопедии Wikipedia и базе данных фактов FreeBase. В 2009 г. был запущен True Knowledge ( http://www.trueknowledge.com ), дающий на английском языке аналитические ответы о фактах.

В мае 2009 г. стартует Wolfram Alpha ( http://www.wolframalpha.com ) - универсальный вычислитель ответов. В Wolfram Alpha интегрирована интеллектуальная логическая система, которая может делать выводы на естественном языке, на основе построения математических моделей и базы знаний и данных. Wolfram Alpha имеет собственную базу знаний и данных, язык запросов очень похож на английский, ответ выводится в виде диаграмм, таблиц и графиков. Например, если ввести запрос «GDP» (ВВП), то на экране появится график изменения ВВП страны, где находится пользователь, за последние тридцать лет. Если ввести запрос «GDP France/Germany», то будет выведен график соотношения ВВП Франции к ВВП Германии за тот же период времени (цит. по http://www.semanticuniverse.com/blogs-doug-lenat-i-was-positively-impressed-wolfram-alpha.html ).

По оценкам экспертов - Nova Spivack ( http://www.twine.com/item/122mz8lz9-4c/wolfram-alpha-is-coming-and-it-could-be-as-important-as-google ), разработчика социальной сети Twine [3], основанной на Artificial Intelligence (искусственном интеллекте) и Doug Lenat (http://www.semanticuniverse.com/blogs-doug-lenat-i-was-positively-impressed-wolfram-alpha.html), разработчика платформы искусственного интеллекта Cyc ( http://www.cyc.com ) для ответов на вопросы пользователей, Wolfram Alpha превосходит по ряду критериев существующие Question-Answering Systems. Автор приглашает российских социологов протестировать  Wolfram Alpha по широкому кругу вопросов, в частности, в области социологии, если разработчики предусмотрели такую возможность. 

В целом, разрабатываемые в настоящий момент современные Question Answering Systems включают в себя Natural Language Processing (NLP) [4-7], в частности, Ontological Semantics Theory, как например, в системе Hakia ( http://hakia.com ), Computational Linguists ( http://www.aclweb.org/index.php?option=com_frontpage&Itemid=1 ), Language Resources ( http://www.elsnet.org/resources.html#ELSNET ), Natural Language Understanding (NLU), как например, в онлайн системе Cognition ( http://www.cognition.com ); Question analysis, в частности, Syntactic parser, Semantic interpreter, Human Language Technology и т.д.; Intelligent Information Retrieval; Answering Validation, в частности, Lexical Validation, Statistical Validation, Logic-Based Processing, Machine Learning; Intelligent Data Warehouse (интеллектуальное «хранилище» знаний и данных) [8]; Knowledge Discovery and Data Mining [9]; Knowledge Computing [10], в частности Сomputational Knowledge, Knowledge Generator, Knowledge Representation и т.д., как, например в Cyc ( http://www.cyc.com ) - системе искусственного интеллекта на английском языке, разработанной для упорядочивания повседневных знаний и ответов на вопросы, имитируя рассуждения человека; Artificial Intelligence (искусственный интеллект), в частности, Computational Intelligence [11] и т.д.

 

Question-Answering Systems: перспективы развития

Сначала рассмотрим перспективы развития компонентов Question Answering Systems.

Natural Language Processing (NLP). Имеются основания [2,5] предполагать, что развитие данного направления будет происходить в русле анализа temporal, spatial, definitional, biographical, multimedia and multilingual question answering. В частности, Computational Linguists ( http://www.aclweb.org/index.php?option=com_content&task=view&id=17&Itemid=28 ) будет развиваться в следующих направлениях. Linguistic data and corpus-based approaches to NLP, Natural Language Generation, Mathematics of Language, Natural Language Learning, Natural Language Parsing, Computational Semantics, Computational Approaches to Semitic Languages, Lexicon (online dictionaries to computational lexical semantics), Web as Corpus и т.д.

Intelligent Data Warehouse. Имеются основания [8] предполагать, что развитие данного направления будет происходить в русле Cognitive Computing,  Dynamic Adaptive Reconfigurable Systems, в которых предусмотрены динамическая реконфигурация (перенастраивание под конкретную содержательную задачу) и т.д.

Knowledge Discovery and Data Mining. Имеются основания [9,12] предполагать, что развитие данного направления будет происходить в русле разработок High-performance Knowledge Discovery and Data Mining systems (высокопроизводительные KDD), в частности, Distributed  Knowledge Discovery and Data Mining (распределенные в географическом пространстве KDD), основанные на технологии Knowledge Grid and Grid Intelligence (KGGI), суперкомпьютинге, в частности, Adaptive Supercomputing [13].

Artificial Intelligence. Имеются основания предполагать, что развитие данного направления будет происходить в русле Artificial General Intelligence (AGI) [14], а именно, Self-improving Artificial intelligence (само совершенствующийся искусственный интеллект) ( http://selfawaresystems.com ). Self-improving Artificial intelligence базируется на четырех основных методологических принципах, а именно, Efficiency, Self-Preservation, Acquisition, Creativity [15] и представляет собой компьютерную систему искусственного интеллекта, которая может самостоятельно ставить цели, изменять программное обеспечение (программировать новые программы) и изменять инфраструктуру компьютера и сети для достижения наибольшей эффективности своего функционирования и развития.

В целом, имеются основания предполагать, что разработка Question Answering Systems будет развиваться в русле прогнозов развития Web, представленных на рис.2-3.

Рис.2

Прогноз развития Web ( http://novaspivack.typepad.com/nova_spivacks_weblog/2007/03/beyond_keyword_.html )

С описанием Web - Intelligence заинтересованный читатель может ознакомиться в [16], с Tagging Systems в [17]. В целом, разработка современных Web - Based Question Answering Systems происходит в рамках Web 3.0, с перспективой на Web 4.0.

Рис.3

Прогноз развития Web ( http://novaspivack.typepad.com/nova_spivacks_weblog/2007/02/steps_towards_a.html )

 

The WebOS или MetaWeb [16]  - это объединение всех компьютеров в единую интеллектуальную сеть (Web - Intelligence) на основе Metacomputing (мета «вычислений») – системная интеграция различных «вычислений» [18], Multilingual Processing [5], Distributed Artificial Social Intelligence (DASI) [16] - распределенного социального искусственного интеллекта, в частности, на основе Artificial Social Intelligence Agents [19]. В этой связи отметим, что Artificial Social Intelligence Agents, каждый из которых обладает Question Answering System, позволяет реализовать компьютерную имитацию опросов общественного мнения.

В целом, одним из ключевых компонентов Web 4.0 будут являться Web - Based Question Answering Systems, прототипом которых является, например, интеллектуальная аналитическая платформа LarKC (The Large Knowledge Collider) ( http://www.larkc.eu ), разрабатываемая в рамках крупного международного проекта, для Large-Scale massive distributed incomplete reasoning.

 

Заключение

Автор, основываясь на личном многолетнем опыте разработки компьютерной экспертно-диагностической системы МАКС [20], прекрасно осознает, что разработка современной эффективной Web - Based Question Answering System на русском языке - это многолетний, сложный научно-технический проект, который требует коллективных действий. Автор также знает, какие проблемы (компьютерные, финансовые, организационные, научные, временные и т.д.)  могут возникнуть в процессе разработки  Question Answering Systems на русском языке и прекрасно понимает, что в настоящий момент времени российская социология не имеет научно-технологических заделов по данной проблематике и ограниченные возможности [8-9,12,16] для разработки современных Web - Based Question Answering Systems.

Вместе с тем, обсуждение и разработка Web - Based Question Answering System «Россия», которая была бы способна на русском языке в режиме онлайн давать научно обоснованные ответы (решения) на проблемы, стоящие перед современной Россией, прогнозы будущих изменений в России и т.д. на основе базы социологических знаний и данных эмпирических исследований, которые уже собраны в России, позволит, с точки зрения автора, сконцентрировать усилия российских социологов на решении фундаментальной научно-практической задачи, важной для граждан России, органов государственного управления РФ, российских социологов.

Не вызывает сомнения, что разработка Web - Based Question Answering System «Россия» будет способствовать интеграции российских социологов, проверке имеющихся социологических знаний о современной России на полноту, точность, связность и т.д., развитию перспективных научных направлений в российской социологии, приросту нового плодотворного социологического научного знания и существенно повысит престиж социологии в современной России.

Может быть, для начала, следует воспользоваться опытом онлайн-сервисов Wiki.answers ( http://wiki.answers.com ), Yahoo! Answers ( http://answers.yahoo.com ), Google - beta «Вопросы и ответы» ( http://otvety.google.ru/otvety ), например, на новом сайте Российского общества социологов (РОС), который стартует в ближайшее время, применительно к проблемам России? Напомним, что Wiki.answers - это Question Answering System, основанная на идеологии и технологии Wikipedia, в которой добровольцы - члены задают  вопросы и отвечают на них, в результате чего формируется База готовых вопросов-ответов. В частности, на 22 апреля 2009 г. в Wiki.answers состояло 2.552.973 членов, которые подготовили 3.790.738 ответов на 11.682.914 вопросов и количество членов, вопросов и ответов постоянно увеличиваются. Закономерности формирования Базы  вопросов-ответов и стратегии поведения членов в подобных онлайн-сервисах изучены ( http://research.microsoft.com/apps/pubs/default.aspx?id=72925 ). По крайней мере, станет понятно, какие классы вопросов задают российские социологи о проблемах России, какие проблемы современной России, в частности, на уровне субъектов РФ, социологи считают общими и частными проблемами, какую информацию социологи используют для ответа (данные официальной статистики, результаты опросов общественного мнения, выдержки из монографий и научных статей, результаты эмпирических исследований, компьютерного моделирования и т.д.), как проверять достоверность, полноту ответов и т.д. Функционирующая и пополняемая в режиме онлайн База готовых вопросов-ответов по проблемам современной России, может стать одним из компонентов будущей Web - Based Question Answering System «Россия».

           

Приглашаем обсудить статью на форуме.

 

СПИСОК ЛИТЕРАТУРЫ

  1. Strzalkowski T., Harabagiu S. Advances in Open Domain Question Answering. Berlin.: Springer, 2006.
  2. Maybury M. New Directions in Question Answering. Menlo Park, California.: Association for the Advancement of Artificial Intelligence Press, 2004.
  3. Давыдов А.А. Twine: искусственный интеллект создает социальные взаимодействия. М.: ИС РАН, 2009. ( https://www.isras.ru/index.php?page_id=974 )
  4. Gelbukh А. Computational Linguistics and Intelligent Text Processing. Berlin.: Springer, 2009.
  5. Jackson P., Moulinier I. Natural Language Processing for Online Applications: Text Retrieval, Extraction and Categorization. Amsterdam.: John Benjamins Pub. 2007.
  6. Delmonte R. Computational Linguistic Text Processing: Logical Form, Semantic Interpretation, Discourse Relations and Question Answering. N.Y.: Nova Science Publishers Inc., 2007.
  7. Kao A., Poteet S. Natural Language Processing and Text Mining. Berlin.: Springer, 2006.
  8. Давыдов А.А. Системная социология: Data Warehousing. М.: ИС РАН, 2009. ( https://www.isras.ru/index.php?page_id=1012 )
  9. Давыдов А.А. Knowledge Discovery and Data Mining в системной социологии. М.: ИС РАН, 2009. ( https://www.isras.ru/Davydov_Knowledge.html )
  10. Davies J., Grobelnik M., Mladenic D. Semantic Knowledge Management: Integrating Ontology Management, Knowledge Discovery and Human Language Technologies. Berlin.: Springer, 2009.
  11. Engelbrecht A. Computational Intelligence: An Introduction. N.Y.: Wiley, 2007.
  12. Давыдов А.А. Системная социология: анализ мультимедийной информации в Интернете. М.: ИС РАН, 2009. ( https://www.isras.ru/index.php?page_id=988 )
  13. Давыдов А.А. Adaptive Supercomputing в системной социологии. М.: ИС РАН, 2009. ( https://www.isras.ru/index.php?page_id=978 )
  14. Goertzel В., Pennachin С. Artificial General Intelligence. Berlin.: Springer, 2007.
  15. Hall J. Self-improving AI: an Analysis//Minds and Machines. 2007, Vol. 17, №3, P.  249-259.
  16. Давыдов А.А. Развитие Интернет-технологий - вызов современной российской социологии. М.: ИС РАН, www( https://www.isras.ru/index.php?page_id=957 )
  17. Давыдов А.А. Системная социология: изучение и использование Collaborative Tagging Systems. М.: ИС РАН, www ( https://www.isras.ru/index.php?page_id=951 )
  18. Давыдов А.А. Системная социология: Social Computing. М.: ИС РАН, 2009. ( https://www.isras.ru/?page_id=1016 )
  19. Давыдов А.А. О компьютационной теории социальных агентов//Социол. исслед. 2006, № 2, С. 19-28.( http://www.ecsocman.edu.ru/socis/msg/301146.html )
  20. Давыдов А.А., Чураков А.Н. Модульный анализ и моделирование социума. М.: ИС РАН, 2000.