Я пытаюсь оценить покупку статистического инструмента. Это будет частично использоваться пользователями, не занимающимися программированием (проводящими клинические исследования), а частично программистами, поэтому я пытаюсь найти хороший компромисс между удобством использования и автоматизацией. Конечно, стоимость - это проблема, но если я смогу собрать прочный корпус, мы, вероятно, сможем купить коммерческий пакет, поэтому мы не ограничены полностью бесплатными вариантами.
Пока что у нас есть следующие варианты:
Что еще есть? Какой отраслевой стандарт? Какие отличительные черты мне следует искать? Что бы вы порекомендовали и почему?
В идеале нам нужен инструмент, который может работать как на Linux, так и на Windows.
(Я работаю в области медицинской визуализации, поэтому мы занимаемся и биостатистикой, и статистикой разработки программного обеспечения)





Я бы посмотрел S-Plus.
Вы получаете мощную среду программирования (S-Plus Workbench, основанную на платформе Eclipse), интуитивно понятный графический интерфейс для непрограммистов и обширное сообщество пользователей (включая пользователей R, основанного на исходной S).
Я лично рекомендую R. Я слышал, его используют биоинформатики и психологи. Не знаю, в чем ваша сфера, так что, возможно, это паршивый выбор. Его довольно легко использовать и изучать.
R управляется из командной строки; у него нет графического интерфейса.
Stata и SPSS, как правило, являются наиболее часто используемыми пакетами в клинических исследованиях. Оба довольно легко подобрать и использовать для людей, не разбирающихся в технике, но в целом они достаточно гибкие. Я использовал Stata больше, чем любой другой, и был очень доволен его параметрами (поддерживает работу как на основе меню, так и из командной строки, достаточно приличная система плагинов для получения новых пользовательских модулей, хорошая поддержка графического отображения).
р немного сложнее для новичков, хотя он популярен среди биостатистов. Поскольку он бесплатный, это еще один приятный момент в его пользу.
rcar, в какой стране ты? В US Pharma SAS гораздо более распространен, чем Stata или SPSS.
США, в академическом медицинском центре. Возможно, здесь дело в культуре, но эти два пакета используют почти все, кто здесь учится, если они не используют R.
Интересно, означает ли это, что ваши сотрудники SAS в какой-то момент перешли на R. Интересные данные, спасибо!
@Gregg Lind - SPSS занимает важное место в психологических исследованиях, особенно на основе опросов.
Рассмотрим еще раз Excel. Это хорошо известно и широко доступно. Обратитесь к этому книга или к этому книга.
Мы пробовали Excel, и, честно говоря, он не дает нам того, что нам нужно эффективно. Встроенные функции не выходят далеко за рамки One-Way Anova, и их часто очень неудобно использовать. Да, я мог бы заново реализовать статистическую структуру в Excel, но это не лучшее использование моего времени.
Что еще опаснее, известно, что Excel содержит ошибки в пакете инструментов анализа, которые делают его непригодным для регрессии.
Визуальные числа - еще один вариант.
Несомненно, это р. R очень дружелюбен к программистам. У него есть функциональные аспекты, и это GNU.
S-PLUS и R основаны на языке S. Оба они похожи, и в большинстве случаев вы можете запускать программу S-PLUS в R и наоборот.
SAS - еще один вариант, хотя он больше ориентирован на бизнес-аналитику и корпоративный сектор. SAS имеет более простой синтаксис, чем R, и, на мой взгляд, его легче понять непрограммисту.
Другие варианты включают SPSS, Matlab и даже Excel.
Похоже, вы пытаетесь достичь нескольких целей. Вы говорите: «Это будет частично использоваться пользователями, не занимающимися программированием (выполняющими клинические исследования), а частично программистами, поэтому я пытаюсь найти хороший компромисс между удобством использования и автоматизацией», с неявным предположением, что это будет Инструмент такой же в обоих случаях, когда это может быть нереально. Какой, например, компромисс для Word и LaTeX?
Несколько разных вопросов о требованиях:
Итак, я читаю об этом:
Легко расширить: R / S-plus, Matlab / Octave (я предпочитаю R, но я делаю больше статистики и меньше матричных вещей) Проста в использовании для обычных людей: Excel, R с пользовательской оболочкой, SPSS
Кроме того, R в Windows имеет ограниченный графический интерфейс, который может помочь вашим пользователям, а может и не помочь.
Если бы это был я, я бы выбрал гибридное решение. Используйте R и дайте непрограммистам шпаргалку для общих задач, которая иллюстрирует общие задачи, или, что еще лучше, напишите несколько функций-оболочек с именами вроде «image_summary», которые автоматизируют их исследовательскую работу.
Для написания фронтенд-скриптов для R также могут помочь оболочки python RPy.
Этот Страница Википедии сравнивает функции, доступные для нескольких статистических пакетов, а также информацию об их совместимости с ОС и ценах (которая кажется немного устаревшей, но дает общее представление)
Для статистического пакета с графическим интерфейсом пользователя, который могут использовать нетехнические пользователи, я бы порекомендовал вам использовать «SAS Enterprise Guide». Вы получите общие и продвинутые процедуры SAS, отличные графические возможности и возможность программирования для технических пользователей. Я рекомендую вам начать с «SAS Learning Edition» (http://support.sas.com/learn/le/), который является полнофункциональной версией Enterprise Guide, но с ограничением обработки только 1000 строк за раз. Это менее 500 долларов, что делает его довольно хорошей сделкой.
SAS Enterprise Guide удобен для непрограммистов. Кроме того, у него есть хорошие возможности для подключения к Excel. А для программистов это самый надежный вариант. Сервер sas работает на чем угодно, однако руководство предприятия предназначено только для Windows.
В итоге мы получили набор инструментов Matlab Statistics (в основном потому, что у нас уже есть некоторый опыт работы с Matlab в команде, и инструмент все равно нужен)
Пока что он делает то, что нам нужно, и его легко расширить. Использование покажет, действительно ли им пользуются непрограммисты, но пока все выглядит хорошо.
Спасибо, что сообщили нам, Кена.
R - очень мощный язык для любого типа статистического моделирования.