Статистические инструменты для программистов

Я пытаюсь оценить покупку статистического инструмента. Это будет частично использоваться пользователями, не занимающимися программированием (проводящими клинические исследования), а частично программистами, поэтому я пытаюсь найти хороший компромисс между удобством использования и автоматизацией. Конечно, стоимость - это проблема, но если я смогу собрать прочный корпус, мы, вероятно, сможем купить коммерческий пакет, поэтому мы не ограничены полностью бесплатными вариантами.

Пока что у нас есть следующие варианты:

  • Statistica (что уже известно некоторым непрограммистам)
  • Набор инструментов Matlab Statistics (программисты уже используют Matlab)
  • Язык R (потребуется пользовательский интерфейс для непрограммистов)
  • Взломайте что-нибудь в Excel (не весело, но именно этим сейчас занимаются непрограммисты)
  • ? ...

Что еще есть? Какой отраслевой стандарт? Какие отличительные черты мне следует искать? Что бы вы порекомендовали и почему?

В идеале нам нужен инструмент, который может работать как на Linux, так и на Windows.

(Я работаю в области медицинской визуализации, поэтому мы занимаемся и биостатистикой, и статистикой разработки программного обеспечения)

Стоит ли изучать PHP в 2026-2027 годах?
Стоит ли изучать PHP в 2026-2027 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
5
0
1 614
11
Перейти к ответу Данный вопрос помечен как решенный

Ответы 11

Я бы посмотрел S-Plus.

Вы получаете мощную среду программирования (S-Plus Workbench, основанную на платформе Eclipse), интуитивно понятный графический интерфейс для непрограммистов и обширное сообщество пользователей (включая пользователей R, основанного на исходной S).

Я лично рекомендую R. Я слышал, его используют биоинформатики и психологи. Не знаю, в чем ваша сфера, так что, возможно, это паршивый выбор. Его довольно легко использовать и изучать.

R - очень мощный язык для любого типа статистического моделирования.

cciotti 10.10.2008 01:59

R управляется из командной строки; у него нет графического интерфейса.

Ben Hoffstein 10.10.2008 02:25
Ответ принят как подходящий

Stata и SPSS, как правило, являются наиболее часто используемыми пакетами в клинических исследованиях. Оба довольно легко подобрать и использовать для людей, не разбирающихся в технике, но в целом они достаточно гибкие. Я использовал Stata больше, чем любой другой, и был очень доволен его параметрами (поддерживает работу как на основе меню, так и из командной строки, достаточно приличная система плагинов для получения новых пользовательских модулей, хорошая поддержка графического отображения).

р немного сложнее для новичков, хотя он популярен среди биостатистов. Поскольку он бесплатный, это еще один приятный момент в его пользу.

rcar, в какой стране ты? В US Pharma SAS гораздо более распространен, чем Stata или SPSS.

Gregg Lind 10.10.2008 17:28

США, в академическом медицинском центре. Возможно, здесь дело в культуре, но эти два пакета используют почти все, кто здесь учится, если они не используют R.

Randy 10.10.2008 21:16

Интересно, означает ли это, что ваши сотрудники SAS в какой-то момент перешли на R. Интересные данные, спасибо!

Gregg Lind 29.10.2008 17:05

@Gregg Lind - SPSS занимает важное место в психологических исследованиях, особенно на основе опросов.

Rob Allen 02.03.2009 04:27

Рассмотрим еще раз Excel. Это хорошо известно и широко доступно. Обратитесь к этому книга или к этому книга.

Мы пробовали Excel, и, честно говоря, он не дает нам того, что нам нужно эффективно. Встроенные функции не выходят далеко за рамки One-Way Anova, и их часто очень неудобно использовать. Да, я мог бы заново реализовать статистическую структуру в Excel, но это не лучшее использование моего времени.

Kena 10.10.2008 05:06

Что еще опаснее, известно, что Excel содержит ошибки в пакете инструментов анализа, которые делают его непригодным для регрессии.

Gregg Lind 10.10.2008 17:31

Визуальные числа - еще один вариант.

Несомненно, это р. R очень дружелюбен к программистам. У него есть функциональные аспекты, и это GNU.

S-PLUS и R основаны на языке S. Оба они похожи, и в большинстве случаев вы можете запускать программу S-PLUS в R и наоборот.

SAS - еще один вариант, хотя он больше ориентирован на бизнес-аналитику и корпоративный сектор. SAS имеет более простой синтаксис, чем R, и, на мой взгляд, его легче понять непрограммисту.

Другие варианты включают SPSS, Matlab и даже Excel.

Похоже, вы пытаетесь достичь нескольких целей. Вы говорите: «Это будет частично использоваться пользователями, не занимающимися программированием (выполняющими клинические исследования), а частично программистами, поэтому я пытаюсь найти хороший компромисс между удобством использования и автоматизацией», с неявным предположением, что это будет Инструмент такой же в обоих случаях, когда это может быть нереально. Какой, например, компромисс для Word и LaTeX?

Несколько разных вопросов о требованиях:

  • Должен ли он быть расширяемым для программистов
    • Возможность использовать расширения C
    • Легко создавать новые процедуры и методы
  • Какой анализ захотят использовать непрограммисты?
  • Графика?
  • Удобство использования для разных групп

Итак, я читаю об этом:

Легко расширить: R / S-plus, Matlab / Octave (я предпочитаю R, но я делаю больше статистики и меньше матричных вещей) Проста в использовании для обычных людей: Excel, R с пользовательской оболочкой, SPSS

Кроме того, R в Windows имеет ограниченный графический интерфейс, который может помочь вашим пользователям, а может и не помочь.

Если бы это был я, я бы выбрал гибридное решение. Используйте R и дайте непрограммистам шпаргалку для общих задач, которая иллюстрирует общие задачи, или, что еще лучше, напишите несколько функций-оболочек с именами вроде «image_summary», которые автоматизируют их исследовательскую работу.

Для написания фронтенд-скриптов для R также могут помочь оболочки python RPy.

Этот Страница Википедии сравнивает функции, доступные для нескольких статистических пакетов, а также информацию об их совместимости с ОС и ценах (которая кажется немного устаревшей, но дает общее представление)

Для статистического пакета с графическим интерфейсом пользователя, который могут использовать нетехнические пользователи, я бы порекомендовал вам использовать «SAS Enterprise Guide». Вы получите общие и продвинутые процедуры SAS, отличные графические возможности и возможность программирования для технических пользователей. Я рекомендую вам начать с «SAS Learning Edition» (http://support.sas.com/learn/le/), который является полнофункциональной версией Enterprise Guide, но с ограничением обработки только 1000 строк за раз. Это менее 500 долларов, что делает его довольно хорошей сделкой.

SAS Enterprise Guide удобен для непрограммистов. Кроме того, у него есть хорошие возможности для подключения к Excel. А для программистов это самый надежный вариант. Сервер sas работает на чем угодно, однако руководство предприятия предназначено только для Windows.

В итоге мы получили набор инструментов Matlab Statistics (в основном потому, что у нас уже есть некоторый опыт работы с Matlab в команде, и инструмент все равно нужен)

Пока что он делает то, что нам нужно, и его легко расширить. Использование покажет, действительно ли им пользуются непрограммисты, но пока все выглядит хорошо.

Спасибо, что сообщили нам, Кена.

Tal Galili 19.02.2010 12:48

Другие вопросы по теме