MeCabのC++ APIを使ってみようかと思うのですが。taggerでnodeを作って。
品詞はnode->featureの値のカンマ区切りを自分でパースしてゲットするので正解?
nodeに品詞の値の要素があってもいいのではと思ったり。
元のテキスト上のオフセットとノードの関係を知りたい場合、node->surfaceが元の
テキストのポインター? バイトオフセットを計算する必要があると。
UTF-16で使いた場合、MeCabってUTF-16でセットアップできるんですかね。それとも
UTF-8でセットアップして、プログラム上で毎回文字コード変換?
などという疑問が早速あるのですが、皆さんいかがしてますでしょう。
個人的にはJavaのBreakIteratorのような使い勝手が欲しいのですが...
探検
自然言語処理スレッド その5
■ このスレッドは過去ログ倉庫に格納されています
888デフォルトの名無しさん
2020/07/08(水) 09:54:53.62ID:15dYshT+■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 江藤農相釈明「消費者への配慮足りなかった」 実際には定期的にコメは買っていると説明 ★4 [少考さん★]
- 石破首相、日本の財政はギリシャより「良くない」-減税をけん制 ★2 [少考さん★]
- 【芸能】永野芽郁、レギュラーラジオも出演辞退 ニッポン放送「ANNX」19日放送から 番組も終了 ★2 [Ailuropoda melanoleuca★]
- 車が子どもの列に突っ込んだか 小学生含む5人搬送 福岡 筑紫野 [香味焙煎★]
- 関西万博で「写真を見て絶句」 大屋根リング周辺に大量の虫が発生…ネットで話題に「不快すぎた」 [バイト歴50年★]
- 大阪万博のフランス館の美術品に虫が大量発生、元宝塚女優が苦言「フランスに謝りたい」 [muffin★]
- 🍏Mrs.GREEN APPLEファンスレ🏡
- 【安倍悲報】トランプ、移民が米市民権かけて争うリアリティー番組を検討🥺 [359965264]
- 🌝tuki.ファンスレ🏡
- 【悲報】万博2億円トイレ、またバチーン!と全面閉鎖🚽【定期】 [359965264]
- 農水大臣、『米を買ったことがない』発言を謝罪「米を買ったことがないような誤解を与えてしまい申し訳ない」 [918862327]
- 【画像】fc2ppvのオッパイモンスター、稼いだ金で大学に行ってしまうww [159091185]