Системная социология: Data Warehousing

Системная социология: Data Warehousing

 А.А.Давыдов

 

 Системная социология: Data Warehousing

 Ключевые слова: системная социология, индустриальный анализ данных

 Введение

 

Накопление эмпирических данных (данные мониторингов и одномоментных опросов общественного мнения, мультимедийная информация в Интернете, в частности, в социальных сетях, блогах, форумах,  и т.д., результаты экспертных опросов) в современной российской социологии, остро ставит проблему использования и разработки Data Warehouse («хранилищ» данных) для хранения и анализа (вторичного, интегрального, совместного и т.д.) собранной социологической информации. Об этом много и неоднократно говорилось, например, член - корр. Н.И.Лапиным  [1], однако, по наблюдениям автора, многие проблемы здесь все еще не решены. Отдельные технологические решения, например, Банк социологических данных в Институте социологии РАН ( https://www.isras.ru/Databank.html ), Единый архив социологических данных  (СОФИСТ) ( http://sofist.socpol.ru/index.shtml?en=0 ) не вполне соответствуют современному мировому уровню, например Банку данных GESIS (German Social Science Infrastructure Service) ( http://www.gesis.org ), который объединяет IZ (Social Science Information Centre), ZA (Central Archive for Empirical Social Research), ZUMA (Centre for Survey Research and Methodology), Roper Centre ( http://www.ropercenter.uconn.edu ). В открытой Базе данных World Values Surveys ( http://www.worldvaluessurvey.org ), которая  содержит результаты мониторинговых международных опросов общественного мнения (более чем 90 стран мира, за период 1981 - 2004 гг.) о субъективном качестве жизни, ценностях и т.д., можно провести статистический Online Data Analysis. С некоторыми зарубежными Social Science Data Archives заинтересованный читатель может ознакомиться на портале ( http://www.sociosite.net/databases.php ).

Кроме того, по наблюдениям автора, российские социологи, попадая в крупные аналитические Центры и компании, испытывают трудности в проведении индустриального анализа данных (потоковый, ежедневный, многократный анализ данных), поскольку недостаточно подготовлены в области современных корпоративных Баз данных.

В данной статье предпринимается еще одна попытка привлечь внимание российских социологов к полезным возможностям Data Warehousing и ее изучению. Скажем сразу, что изучение и навыки разработки Data Warehousing специалисты по IT (информационным технологиям) получают в процессе нескольких лет обучения, существует множество объемных справочных руководств, учебников и пособий по Data Warehousing. Поэтому автор сосредоточился только на одном важном компоненте Data Warehousing, а именно, кратком описании систем Data  Mining («добыча» знаний из данных), которые изначально встроены в Data Warehousing. Особо подчеркнем, что многие системы Knowledge Discovery and Data Mining [2] стоят дорого, поэтому иногда экономически выгоднее запрограммировать какую-либо модель и (или) метод Knowledge Discovery and Data Mining для решения конкретной содержательной задачи, используя изначально встроенные средства Data Mining в Data Warehousing. В настоящей статье также рассмотрены некоторые перспективы разработки Data Warehousing в системной социологии...

Полный текст статьи

Пожалуйста, комментируйте, оставляйте свои сообщения в форуме или присылайте свои статьи, замечания и комментарии на адрес: blog@isras.ru

  1. Социальная информатика: основания, методы, перспективы/Под ред. Н.И. Лапина, 2-е издание. М.: Эдиториал УРСС, 2006.
  2. Давыдов А.А. Knowledge Discovery and Data Mining в системной социологии. М.: ИС РАН, 2009. ( https://www.isras.ru/Davydov_Knowledge.html )