Редактировал(а) Coluns 02.12.2024

От версии 1.4
отредактировано Coluns
на 23.10.2024
Изменить комментарий: (Autosaved)
К версии 4.1
отредактировано Coluns
на 23.10.2024
Изменить комментарий: Загрузить новое изображение XWikiR3.png

Сводка

Подробности

Свойства страницы
Содержимое
... ... @@ -1,21 +1,89 @@
1 1  == Что такое язык программирования R ==
2 2  
3 -**R язык программирования, созданный специально для статистического анализа данных**. Его разработали на факультете статистики Оклендского университета. [[1>>url:https://practicum.yandex.ru/blog/chto-takoe-yazyk-r/]]
3 +**R - язык программирования, созданный специально для статистического анализа данных**. Его разработали на факультете статистики Оклендского университета.
4 4  
5 5  **Особенности языка R**:
6 6  
7 -* **Интерпретируемый**. Программа на языке R сразу готова к исполнению — её не нужно собирать в исполняемый файл с помощью компилятора. [[1>>url:https://practicum.yandex.ru/blog/chto-takoe-yazyk-r/]]
8 -* **Простой по синтаксису**. R в своей основе не содержит сложных конструкций и запутанных функций. Даже типов данных у него всего четыре: символьные, числовые, логические и комплексные. [[1>>url:https://practicum.yandex.ru/blog/chto-takoe-yazyk-r/]]
9 -* **Рабочая среда**. В R встроены готовые методы статистического анализа и инструменты для визуализации. [[1>>url:https://practicum.yandex.ru/blog/chto-takoe-yazyk-r/]]
7 +* **Интерпретируемый**. Программа на языке R сразу готова к исполнению — её не нужно собирать в исполняемый файл с помощью компилятора.
8 +* **Простой по синтаксису**. R в своей основе не содержит сложных конструкций и запутанных функций. Даже типов данных у него всего четыре: символьные, числовые, логические и комплексные.
9 +* **Рабочая среда**. В R встроены готовые методы статистического анализа и инструменты для визуализации.
10 10  
11 -**Сфера применения языка R**: математики, биологи, генетики и другие учёные, которым нужно проводить статистические исследования и строить модели. Также R востребован среди аналитиков данных и специалистов по Data Science. [[1>>url:https://practicum.yandex.ru/blog/chto-takoe-yazyk-r/]]
11 +**Сфера применения языка R**: математики, биологи, генетики и другие учёные, которым нужно проводить статистические исследования и строить модели. Также R востребован среди аналитиков данных и специалистов по Data Science.
12 12  
13 -**Распространение**: язык и среда доступны под лицензией GNU GPL. [[2>>url:https://ru.wikipedia.org/wiki/R_(%D1%8F%D0%B7%D1%8B%D0%BA_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F)]][[3>>url:https://ru.ruwiki.ru/wiki/R_(%D1%8F%D0%B7%D1%8B%D0%BA_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F)]] Распространяются в виде исходных кодов, а также откомпилированных приложений под ряд операционных систем.
13 +**Распространение**: язык и среда доступны под лицензией GNU GPL. Распространяются в виде исходных кодов, а также откомпилированных приложений под ряд операционных систем.
14 14  
15 15  == Какая польза от использования языка R в бизнесе ==
16 16  
17 +С точки зрения бизнеса разработку приложений для анализа данных на языке R можно считать почти идеальным решением:
18 +
19 +1. Отсутствуют какие-либо финансовые барьеры для начала использования:
20 +1*. Не надо никаких первоначальный вложений в лицензии.
21 +1*. Нет никаких лицензионных ограничений и проблем потенциального расширения.
22 +1*. Нет никаких ежегодных платежей за поддержку лицензий.
23 +1*. Все прекрасно работает на linux, нет необходимости в приобретении дополнительных ОС.
24 +1. Если ваши внешние системы выдают необходимую информацию, то этого уже достаточно для начала проекта. **Сопутствующие проекты по доработке не требуются**, все можно будет сделать на уровне аналитики.
25 +1. Уже есть доказанная практика применения R в бизнесе практически во всех вертикалях.
26 +1. Не надо планировать глобальный проект, достаточно начать с частных проблемных мест.
27 +1*. Проекты получаются компактными и быстрыми, результаты легко переводятся в деньги (заработанные или сэкономленные).
28 +1*. Полученные результаты позволяют взглянуть на существующие задачи под иным углом зрения, обнаружить реальные проблемы и расставить акценты в более правильном виде.
29 +
30 +== Что умеют приложения на R ==
31 +
32 +* Импорт данных из различных источников.** txt\csv**, **xls **(Excel), web scrapping, RDBMS.
33 +* Обработка данных: фильтрация, группировка, агрегирование, добавление и вычисление.
34 +* Временной анализ (как правило, 80% данных сопровождаются временными метками).
35 +* Расширенная обработка (элементы высшей математики, включая элементы машинного обучения): Наиболее популярен поиск аномалий, различные классификаторы, рекомендации и прогнозирование и Process mining.
36 +* Визуализация данных различными способами.
37 +* Интеграция с внешними информационными системами для экспорта рассчитанных данных.
38 +* Экспорт в форматы, удобные для восприятия человеком, такие как: **pdf**, **html**, **xls**, **doc**, **ppt**.
39 +* Web-base рабочее место для аналитика\рядового пользователя.
40 +
41 +Приведенный функционал доступен в рамках экосистемы R без особой необходимости инсталляции каких-либо дополнительных сторонних компонент.
42 +
17 17  == Как работает интеграция между Corpwiki (XWiki) и приложениями на языке R ==
18 18  
45 +Мы в Corpwiki разработали подход позволяющий использовать всю мощь приложений написанных на языке R в XWiki.
46 +
47 +Это позволяет не только обогатить содержание баз знаний (корпоративных вики) визуально привлекательной инфографикой но и реализовать много интересных с точки зрения бизнеса решений.
48 +
49 +Схематично процесс взаимодействия выглядит следующим образом:
50 +
51 +[[image:Внешние данные.png||height="848" width="1200"]]
52 +
53 +На страницу XWiki встраивается небольшой кусочек кода.
54 +
55 +При обращении пользователя к такой странице, она запрашивает данные у сервиса обработки.
56 +
57 +Данный сервис устанавливается "рядом" с XWiki и если например, ваша база знаний расположена на ваших серверах, то вы сможете также разместить данный сервис у  себя.
58 +
59 +Безопасность корпоративных данных гарантирована.
60 +
61 +Сервис обращается уже к XWiki откуда "забирает" данные для формирования отчетов или графики.
62 +
63 +Такие данные могут забираться "в сыром" виде.
64 +
65 +Вся обработка данных (фильтрация, группировка, вычисления, обогащение) происходят на стороне сервиса.
66 +
67 +После того как данные готовы для отображения, система возвращает их в XWiki и пользователь видит готовый результат.
68 +
69 +Для пользователя все выглядит так как будто он просто открыл страницу.
70 +
71 +Созданная инфографика является интерактивной.
72 +
73 +Другими словами есть возможность добавлять элементы управления на такие страницы и пользователи в режиме реального времени могут изменять настройки отображения.
74 +
75 +=== Внешние данные ===
76 +
77 +Как можно увидеть на схеме, данные могут быть получены не только из объектов данных XWiki но и из любых внешних источников данных.
78 +
79 +Это могут быть корпоративные приложения, базы данных, файлы Excel и тому подобное.
80 +
81 +Данные из разных систем можно объединять и использовать для формирования отчетности и инфографики.
82 +
83 +Таким образом вы сможете превратить вашу базу знаний в витрину данных или BI систему.
84 +
85 +Посмотрите в разделе примеров какие возможности дает для отображения данных данный подход.
86 +
19 19  == Примеры результатов работы приложений на языке R ==
20 20  
21 21  
XWikiR1.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.coluns
Размер
... ... @@ -1,0 +1,1 @@
1 +301.5 KB
Содержимое
XWikiR2.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.coluns
Размер
... ... @@ -1,0 +1,1 @@
1 +246.3 KB
Содержимое
XWikiR3.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.coluns
Размер
... ... @@ -1,0 +1,1 @@
1 +119.4 KB
Содержимое
Внешние данные.png
Author
... ... @@ -1,0 +1,1 @@
1 +XWiki.coluns
Размер
... ... @@ -1,0 +1,1 @@
1 +236.3 KB
Содержимое