Smilart – Data Mining
site map  |  contacts  
Data Mining
Технологии





Data Mining

Развитие методов записи и хранения данных привело к бурному росту объемов собираемой и анализируемой информации. Объемы данных настолько внушительны, что человеку просто не по силам проанализировать их самостоятельно, хотя необходимость проведения такого анализа вполне очевидна, ведь в этих "сырых" данных заключены знания, которые могут быть использованы при принятии решений. Для того чтобы провести автоматический анализ данных, используется Data Mining.
 
Data Mining – это процесс обнаружения в "сырых" данных ранее неизвестных нетривиальных практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
 
Информация, найденная в процессе применения методов Data Mining, должна быть нетривиальной и ранее неизвестной, например, средние продажи не являются таковыми. Знания должны описывать новые связи между свойствами, предсказывать значения одних признаков на основе других и т.д. Найденные знания должны быть применимы и на новых данных с некоторой степенью достоверности. Полезность заключается в том, что эти знания могут приносить определенную выгоду при их применении. Знания должны быть в понятном для пользователя не математика виде. Например, проще всего воспринимаются человеком логические конструкции 'если … то …'. Более того, такие правила могут быть использованы в различных базах данных в качестве запросов. В случае, когда извлеченные знания непрозрачны для пользователя, должны существовать методы постобработки, позволяющие привести их к понятному интерпретируемому виду.
 
Алгоритмы, используемые в Data Mining, требуют большого количества вычислений. Раньше это являлось сдерживающим фактором его широкого практического применения. Однако сегодняшний рост производительности современных процессоров и перспективные разработки компании Smilart, решили остроту этой проблемы. Теперь за приемлемое время можно провести качественный анализ огромного объёма информации.
 
Проблемы бизнес анализа формулируются по разному, но решение большинства из них сводится к той или иной задаче Data Mining или к их комбинации. Например, оценка рисков – это решение задачи регрессии или классификации, сегментация рынка – кластеризация, стимулирование спроса – ассоциативные правила. Фактически, задачи Data Mining являются элементами, из которых можно собрать решение подавляющего большинства реальных бизнес задач.
 
Для решения поставленных задач, Smilart используюет различные методы и алгоритмы Data Mining. Ввиду того, что Data Mining развивалась и развивается на стыке таких дисциплин, как математический анализ, статистика, теория информации, машинное обучение, теория баз данных, вполне закономерно, что компания Smilart большинство собственых  алгоритмов и методов Data Mining разработала на основе различных методов из этих дисциплин.
contact
Информация: info@smilart.com
Техподдержка: support@smilart.com
       Copyright  |  Terms of Use  |  Privacy