Изменения документа Анализ и визуализация данных в Corpwiki (XWiki) с применением языка R
Редактировал(а) Coluns 02.12.2024
Сводка
-
Свойства страницы (1 изменено, 0 добавлено, 0 удалено)
Подробности
- Свойства страницы
-
- Содержимое
-
... ... @@ -1,7 +1,50 @@ 1 -(% class="wikigeneratedid" id="H42144243044244C44F" %) 2 - 1 +== Что такое язык программирования R == 3 3 3 +**R - язык программирования, созданный специально для статистического анализа данных**. Его разработали на факультете статистики Оклендского университета. 4 4 5 +**Особенности языка R**: 6 + 7 +* **Интерпретируемый**. Программа на языке R сразу готова к исполнению — её не нужно собирать в исполняемый файл с помощью компилятора. 8 +* **Простой по синтаксису**. R в своей основе не содержит сложных конструкций и запутанных функций. Даже типов данных у него всего четыре: символьные, числовые, логические и комплексные. 9 +* **Рабочая среда**. В R встроены готовые методы статистического анализа и инструменты для визуализации. 10 + 11 +**Сфера применения языка R**: математики, биологи, генетики и другие учёные, которым нужно проводить статистические исследования и строить модели. Также R востребован среди аналитиков данных и специалистов по Data Science. 12 + 13 +**Распространение**: язык и среда доступны под лицензией GNU GPL. Распространяются в виде исходных кодов, а также откомпилированных приложений под ряд операционных систем. 14 + 15 +== Какая польза от использования языка R в бизнесе == 16 + 17 +С точки зрения бизнеса разработку приложений для анализа данных на языке R можно считать почти идеальным решением: 18 + 19 +1. Отсутствуют какие-либо финансовые барьеры для начала использования: 20 +1*. Не надо никаких первоначальный вложений в лицензии. 21 +1*. Нет никаких лицензионных ограничений и проблем потенциального расширения. 22 +1*. Нет никаких ежегодных платежей за поддержку лицензий. 23 +1*. Все прекрасно работает на linux, нет необходимости в приобретении дополнительных ОС. 24 +1. Если ваши внешние системы выдают необходимую информацию, то этого уже достаточно для начала проекта. **Сопутствующие проекты по доработке не требуются**, все можно будет сделать на уровне аналитики. 25 +1. Уже есть доказанная практика применения R в бизнесе практически во всех вертикалях. 26 +1. Не надо планировать глобальный проект, достаточно начать с частных проблемных мест. 27 +1*. Проекты получаются компактными и быстрыми, результаты легко переводятся в деньги (заработанные или сэкономленные). 28 +1*. Полученные результаты позволяют взглянуть на существующие задачи под иным углом зрения, обнаружить реальные проблемы и расставить акценты в более правильном виде. 29 + 30 +== Что умеют приложения на R == 31 + 32 +* Импорт данных из различных источников.** txt\csv**, **xls **(Excel), web scrapping, RDBMS. 33 +* Обработка данных: фильтрация, группировка, агрегирование, добавление и вычисление. 34 +* Временной анализ (как правило, 80% данных сопровождаются временными метками). 35 +* Расширенная обработка (элементы высшей математики, включая элементы машинного обучения): Наиболее популярен поиск аномалий, различные классификаторы, рекомендации и прогнозирование и "process mining". 36 +* Визуализация данных различными способами. 37 +* Интеграция с внешними информационными системами для экспорта рассчитанных данных. 38 +* Экспорт в форматы, удобные для восприятия человеком, такие как: **pdf**, **html**, **xls**, **doc**, **ppt**. 39 +* Web-base рабочее место для аналитика\рядового пользователя. 40 + 41 +Приведенный функционал доступен в рамках экосистемы R без особой необходимости инсталляции каких-либо дополнительных сторонних компонент. 42 + 43 +== Как работает интеграция между Corpwiki (XWiki) и приложениями на языке R == 44 + 45 +== Примеры результатов работы приложений на языке R == 46 + 47 + 5 5 ---- 6 6 7 7 {{cl-plate-help/}}