Системная социология: Data Warehousing
А.А.Давыдов
Системная социология: Data Warehousing
Ключевые слова: системная социология, индустриальный анализ данных
Введение
Накопление эмпирических данных (данные мониторингов и одномоментных опросов общественного мнения, мультимедийная информация в Интернете, в частности, в социальных сетях, блогах, форумах, и т.д., результаты экспертных опросов) в современной российской социологии, остро ставит проблему использования и разработки Data Warehouse («хранилищ» данных) для хранения и анализа (вторичного, интегрального, совместного и т.д.) собранной социологической информации. Об этом много и неоднократно говорилось, например, член - корр. Н.И.Лапиным [1], однако, по наблюдениям автора, многие проблемы здесь все еще не решены. Отдельные технологические решения, например, Банк социологических данных в Институте социологии РАН ( https://www.isras.ru/Databank.html ), Единый архив социологических данных (СОФИСТ) ( http://sofist.socpol.ru/index.shtml?en=0 ) не вполне соответствуют современному мировому уровню, например Банку данных GESIS (German Social Science Infrastructure Service) ( http://www.gesis.org ), который объединяет IZ (Social Science Information Centre), ZA (Central Archive for Empirical Social Research), ZUMA (Centre for Survey Research and Methodology), Roper Centre ( http://www.ropercenter.uconn.edu ). В открытой Базе данных World Values Surveys ( http://www.worldvaluessurvey.org ), которая содержит результаты мониторинговых международных опросов общественного мнения (более чем 90 стран мира, за период 1981 - 2004 гг.) о субъективном качестве жизни, ценностях и т.д., можно провести статистический Online Data Analysis. С некоторыми зарубежными Social Science Data Archives заинтересованный читатель может ознакомиться на портале ( http://www.sociosite.net/databases.php ).
Кроме того, по наблюдениям автора, российские социологи, попадая в крупные аналитические Центры и компании, испытывают трудности в проведении индустриального анализа данных (потоковый, ежедневный, многократный анализ данных), поскольку недостаточно подготовлены в области современных корпоративных Баз данных.
В данной статье предпринимается еще одна попытка привлечь внимание российских социологов к полезным возможностям Data Warehousing и ее изучению. Скажем сразу, что изучение и навыки разработки Data Warehousing специалисты по IT (информационным технологиям) получают в процессе нескольких лет обучения, существует множество объемных справочных руководств, учебников и пособий по Data Warehousing. Поэтому автор сосредоточился только на одном важном компоненте Data Warehousing, а именно, кратком описании систем Data Mining («добыча» знаний из данных), которые изначально встроены в Data Warehousing. Особо подчеркнем, что многие системы Knowledge Discovery and Data Mining [2] стоят дорого, поэтому иногда экономически выгоднее запрограммировать какую-либо модель и (или) метод Knowledge Discovery and Data Mining для решения конкретной содержательной задачи, используя изначально встроенные средства Data Mining в Data Warehousing. В настоящей статье также рассмотрены некоторые перспективы разработки Data Warehousing в системной социологии...
Пожалуйста, комментируйте, оставляйте свои сообщения в форуме или присылайте свои статьи, замечания и комментарии на адрес: blog@isras.ru
- Социальная информатика: основания, методы, перспективы/Под ред. Н.И. Лапина, 2-е издание. М.: Эдиториал УРСС, 2006.
- Давыдов А.А. Knowledge Discovery and Data Mining в системной социологии. М.: ИС РАН, 2009. ( https://www.isras.ru/Davydov_Knowledge.html )