Большие данные. Датаизм

дата, датаизм, дата-изм, date, datatism, datat-ism, книги про датаизм


В последнее время интерес к « большим данным » все более распространяется. При этом под « большими данными » мы понимаем не только огромные массивы информации, но и возможность получать ее на регулярной основе с той же или большей степенью подробности.

Большие данные — обозначение структурированных и неструктурированных данных огромных объёмов и значительного многообразия, эффективно обрабатываемых горизонтально масштабируемыми программными инструментами, появившимися в конце 2000‑х годов и альтернативных традиционным системам управления базами данных и решениям класса Busi­ness Intelligence.

Википедия

Массивы информации и датаизм 

Как правило, такие массивы информации содержат в себе все, что возможно для их анализа : это и документы на бумажных носителях, и базы данных, и электронные сервисы, и даже аудиозаписи. Проблемы массивов данных « объемной » становится любая информация, так или иначе содержащая большие массивы данных. 

В широком смысле о « больших данных » говорят как о социально-экономическом феномене, связанном с появлением технологических возможностей анализировать огромные массивы данных, в некоторых проблемных областях — весь мировой объём данных, и вытекающих из этого трансформационных последствий.

Википедия

Это и финансовая отчетность крупных компаний, и демографические данные, и информация о пользователях социальных сетей, и данные, собранные в результате проведения социологических исследований, и многое другое. Все это требует сбора, обработки и анализа такого количества информации. Чем больше объем информации, тем более сложные алгоритмы необходимо использовать для ее обработки. 

ЛитРес

Обработка данных и датаизм

Соответственно, чтобы обработать большое количество информации, нужны более мощные вычислительные ресурсы, а значит, потребуется больше инвестиций в развитие информационной безопасности. Также растет интерес к Big Data со стороны крупных компаний и корпораций, которые используют их в различных бизнес-процессах, — это, прежде всего, торговля, банки, производственные отрасли. 

MapRe­duce – это модель распределенной обработки данных, предложенная компанией Google для обработки больших объёмов данных на компьютерных кластерах.

habr​.com

Но, к сожалению, интерес есть, а вот с реализацией дела обстоят намного хуже. На российском рынке до сих пор не существует системного подхода к управлению и обработке таких массивов информации. 

Проблемы массивов данных. Датаизм 

Проблема управления такими массивами информации вызвана еще и тем, что пользователи и управляющие ими лица могут трактовать информацию по-разному. Часто встречаются случаи, когда данные обрабатываются автоматически на основе заранее сформированной модели.

Анализ Больших Данных требует от нас чтобы мы одновременно оценили и проверили много параметров. Ошибки оценки накапливаются тогда, когда решение или правило прогнозирования зависит от большого количества таких параметров

habr​.com
  Автор идеи: Штольц Юлий; редактор: Юлия Штольц; создано при помощи языковой модели Яндекс: YaLM.  

Книга уже доступна на Литрес :
“Датаизм : о бесконечности алгоритмов жизни”

Книги по теме :

  1. Sapi­ens. Краткая история человечества, автор : Юваль Ной Харари ;
  2. Homo Deus. Краткая история будущего, автор : Юваль Ной Харари ;
  3. Краткая история почти всего на свете : экскурсия в окружающий мир, автор : Билл Брайсон ;
  4. Краткая история времени. От Большого взрыва до черных дыр, автор : Стивен Хокинг ;
  5. Краткие ответы на большие вопросы, автор : Стивен Хокинг ;
  6. Физика невозможного, автор : Митио Каку ;
  7. Самое грандиозное шоу на Земле : доказательства эволюции, автор : Ричард Докинз.

ivi.ru [CPS]

Рекомендованные статьи