リクルート、Python向け日本語自然言語処理オープンソースライブラリ「GiNZA」公開
2019年04月03日 13時43分 公開
https://www.itmedia.co.jp/news/articles/1904/03/news087.html
リクルートはこのほど、同社のAI研究機関・Megagon Labsが開発したPython向け日本語
自然言語処理オープンソースライブラリ「GiNZA」(ギンザ)と、国立国語研究所と共同で
研究してきた学習済みモデルを組み込んだ「GiNZA日本語Universal Dependencies(UD)
モデル」をGitHubで公開した。
GiNZAは、複雑な導入作業不要で、ワンステップでモジュールとモデルファイルの導入が
可能なライブラリ。エンジニアやデータサイエンティストが自然言語処理を簡単に応用
できることを目指して開発したという。
自然言語処理ライブラリ「spaCy」をフレームワークとして利用し、オープンソース形態素
解析器「SudachiPy」を組み込んでおり、「産業用途に耐える性能を備えている」としている。
spaCyの国際化機能により、複数の欧米言語と日本語の言語リソースを切り替えて使用する
こともできる。
「GiNZA日本語UDモデル」には、Megagon Labsが国立国語研究所と共同で研究してきた
学習済みモデルを組み込んだ。国立国語研究所が蓄積してきた大規模・高品質なテキスト
コーパスに、日本語Wikipediaテキストも同時に用いて機械学習に適用しており、幅広い
分野に適応可能なモデルを構築したという。
探検
Pythonのお勉強 Part59
■ このスレッドは過去ログ倉庫に格納されています
408デフォルトの名無しさん
2019/04/04(木) 08:47:56.04ID:mwipv9yH■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【地震速報】青森県で震度6強 沿岸部に津波警報 ★5 [ぐれ★]
- 【地震速報】青森県で震度6強 沿岸部に津波警報 ★6 [ぐれ★]
- 「日の丸にバツ印」掲げた大学生 あいまいな国旗損壊罪に「怖い」 The Mainichi [少考さん★]
- 高市内閣「支持」64%「不支持」19% NHK世論調査 ★2 [少考さん★]
- 【速報】気象庁がマグニチュード7.5に修正しました [ニョキニョキ★]
- 北海道・三陸沖後発地震注意情報を発表 気象庁 内閣府 [ぐれ★]
- かっぱ寿司←こいつが天下取れなかった理由
- 何でデートでリュック背負って来たらダメなの?
- ぺこーら、地震で同僚が次々配信を止めるなか強行し続けるので悪目立ちするwww [268244553]
- 有名配信者「サッカーで野蛮なのは日本の黄色い猿だけ」
- 巨大地震 [957955821]
- 中国「日本は戦後80年経っても過去の加害行為を反省してない」 [805596214]
