Изменения документа Анализ и визуализация данных в Corpwiki (XWiki) с применением языка R
Редактировал(а) Coluns 02.12.2024
Сводка
-
Свойства страницы (1 изменено, 0 добавлено, 0 удалено)
-
Вложения (0 изменено, 0 добавлено, 4 удалено)
Подробности
- Свойства страницы
-
- Содержимое
-
... ... @@ -1,89 +1,21 @@ 1 1 == Что такое язык программирования R == 2 2 3 -**R -язык программирования, созданный специально для статистического анализа данных**. Его разработали на факультете статистики Оклендского университета.3 +**R — язык программирования, созданный специально для статистического анализа данных**. Его разработали на факультете статистики Оклендского университета. [[1>>url:https://practicum.yandex.ru/blog/chto-takoe-yazyk-r/]] 4 4 5 5 **Особенности языка R**: 6 6 7 -* **Интерпретируемый**. Программа на языке R сразу готова к исполнению — её не нужно собирать в исполняемый файл с помощью компилятора. 8 -* **Простой по синтаксису**. R в своей основе не содержит сложных конструкций и запутанных функций. Даже типов данных у него всего четыре: символьные, числовые, логические и комплексные. 9 -* **Рабочая среда**. В R встроены готовые методы статистического анализа и инструменты для визуализации. 7 +* **Интерпретируемый**. Программа на языке R сразу готова к исполнению — её не нужно собирать в исполняемый файл с помощью компилятора. [[1>>url:https://practicum.yandex.ru/blog/chto-takoe-yazyk-r/]] 8 +* **Простой по синтаксису**. R в своей основе не содержит сложных конструкций и запутанных функций. Даже типов данных у него всего четыре: символьные, числовые, логические и комплексные. [[1>>url:https://practicum.yandex.ru/blog/chto-takoe-yazyk-r/]] 9 +* **Рабочая среда**. В R встроены готовые методы статистического анализа и инструменты для визуализации. [[1>>url:https://practicum.yandex.ru/blog/chto-takoe-yazyk-r/]] 10 10 11 -**Сфера применения языка R**: математики, биологи, генетики и другие учёные, которым нужно проводить статистические исследования и строить модели. Также R востребован среди аналитиков данных и специалистов по Data Science. 11 +**Сфера применения языка R**: математики, биологи, генетики и другие учёные, которым нужно проводить статистические исследования и строить модели. Также R востребован среди аналитиков данных и специалистов по Data Science. [[1>>url:https://practicum.yandex.ru/blog/chto-takoe-yazyk-r/]] 12 12 13 -**Распространение**: язык и среда доступны под лицензией GNU GPL. 13 +**Распространение**: язык и среда доступны под лицензией GNU GPL. [[2>>url:https://ru.wikipedia.org/wiki/R_(%D1%8F%D0%B7%D1%8B%D0%BA_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F)]][[3>>url:https://ru.ruwiki.ru/wiki/R_(%D1%8F%D0%B7%D1%8B%D0%BA_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F)]] Распространяются в виде исходных кодов, а также откомпилированных приложений под ряд операционных систем. 14 14 15 15 == Какая польза от использования языка R в бизнесе == 16 16 17 -С точки зрения бизнеса разработку приложений для анализа данных на языке R можно считать почти идеальным решением: 18 - 19 -1. Отсутствуют какие-либо финансовые барьеры для начала использования: 20 -1*. Не надо никаких первоначальный вложений в лицензии. 21 -1*. Нет никаких лицензионных ограничений и проблем потенциального расширения. 22 -1*. Нет никаких ежегодных платежей за поддержку лицензий. 23 -1*. Все прекрасно работает на linux, нет необходимости в приобретении дополнительных ОС. 24 -1. Если ваши внешние системы выдают необходимую информацию, то этого уже достаточно для начала проекта. **Сопутствующие проекты по доработке не требуются**, все можно будет сделать на уровне аналитики. 25 -1. Уже есть доказанная практика применения R в бизнесе практически во всех вертикалях. 26 -1. Не надо планировать глобальный проект, достаточно начать с частных проблемных мест. 27 -1*. Проекты получаются компактными и быстрыми, результаты легко переводятся в деньги (заработанные или сэкономленные). 28 -1*. Полученные результаты позволяют взглянуть на существующие задачи под иным углом зрения, обнаружить реальные проблемы и расставить акценты в более правильном виде. 29 - 30 -== Что умеют приложения на R == 31 - 32 -* Импорт данных из различных источников.** txt\csv**, **xls **(Excel), web scrapping, RDBMS. 33 -* Обработка данных: фильтрация, группировка, агрегирование, добавление и вычисление. 34 -* Временной анализ (как правило, 80% данных сопровождаются временными метками). 35 -* Расширенная обработка (элементы высшей математики, включая элементы машинного обучения): Наиболее популярен поиск аномалий, различные классификаторы, рекомендации и прогнозирование и Process mining. 36 -* Визуализация данных различными способами. 37 -* Интеграция с внешними информационными системами для экспорта рассчитанных данных. 38 -* Экспорт в форматы, удобные для восприятия человеком, такие как: **pdf**, **html**, **xls**, **doc**, **ppt**. 39 -* Web-base рабочее место для аналитика\рядового пользователя. 40 - 41 -Приведенный функционал доступен в рамках экосистемы R без особой необходимости инсталляции каких-либо дополнительных сторонних компонент. 42 - 43 43 == Как работает интеграция между Corpwiki (XWiki) и приложениями на языке R == 44 44 45 -Мы в Corpwiki разработали подход позволяющий использовать всю мощь приложений написанных на языке R в XWiki. 46 - 47 -Это позволяет не только обогатить содержание баз знаний (корпоративных вики) визуально привлекательной инфографикой но и реализовать много интересных с точки зрения бизнеса решений. 48 - 49 -Схематично процесс взаимодействия выглядит следующим образом: 50 - 51 -[[image:Внешние данные.png||height="848" width="1200"]] 52 - 53 -На страницу XWiki встраивается небольшой кусочек кода. 54 - 55 -При обращении пользователя к такой странице, она запрашивает данные у сервиса обработки. 56 - 57 -Данный сервис устанавливается "рядом" с XWiki и если например, ваша база знаний расположена на ваших серверах, то вы сможете также разместить данный сервис у себя. 58 - 59 -Безопасность корпоративных данных гарантирована. 60 - 61 -Сервис обращается уже к XWiki откуда "забирает" данные для формирования отчетов или графики. 62 - 63 -Такие данные могут забираться "в сыром" виде. 64 - 65 -Вся обработка данных (фильтрация, группировка, вычисления, обогащение) происходят на стороне сервиса. 66 - 67 -После того как данные готовы для отображения, система возвращает их в XWiki и пользователь видит готовый результат. 68 - 69 -Для пользователя все выглядит так как будто он просто открыл страницу. 70 - 71 -Созданная инфографика является интерактивной. 72 - 73 -Другими словами есть возможность добавлять элементы управления на такие страницы и пользователи в режиме реального времени могут изменять настройки отображения. 74 - 75 -=== Внешние данные === 76 - 77 -Как можно увидеть на схеме, данные могут быть получены не только из объектов данных XWiki но и из любых внешних источников данных. 78 - 79 -Это могут быть корпоративные приложения, базы данных, файлы Excel и тому подобное. 80 - 81 -Данные из разных систем можно объединять и использовать для формирования отчетности и инфографики. 82 - 83 -Таким образом вы сможете превратить вашу базу знаний в витрину данных или BI систему. 84 - 85 -Посмотрите в разделе примеров какие возможности дает для отображения данных данный подход. 86 - 87 87 == Примеры результатов работы приложений на языке R == 88 88 89 89
- XWikiR1.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.coluns - Размер
-
... ... @@ -1,1 +1,0 @@ 1 -301.5 KB - Содержимое
- XWikiR2.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.coluns - Размер
-
... ... @@ -1,1 +1,0 @@ 1 -246.3 KB - Содержимое
- XWikiR3.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.coluns - Размер
-
... ... @@ -1,1 +1,0 @@ 1 -119.4 KB - Содержимое
- Внешние данные.png
-
- Author
-
... ... @@ -1,1 +1,0 @@ 1 -XWiki.coluns - Размер
-
... ... @@ -1,1 +1,0 @@ 1 -236.3 KB - Содержимое