Библиотека Goose, согласно ее веб-сайту, является экстрактором HTML-контента / статей в Scala. Его миссия - взять любую новостную статью или веб-страницу типа статьи и извлечь не только то, что является основной частью статьи, но также все метаданные и наиболее вероятный кандидат на изображение.