現代書き言葉UniDic
現代の書き言葉テキストを短単位自動解析するための解析用辞書です。 以下のようなテキストの解析に使用できます。
この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。 |
ライセンス | ||||
GPL v2.0/LGPL v2.1/修正BSD | |||||
参考文献
- 伝 康晴, 小木曽 智信, 小椋 秀樹, 山田 篤, 峯松 信明, 内元 清貴, 小磯 花絵: 「コーパス日本語学のための言語資源:形態素解析用電子化辞書の開発とその応用」, 日本語科学, Vol.22, pp.101-123 (2007).
- 岡 照晃: 「CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic ― unidic-cwj-2.2.0 と unidic-csj-2.2.0 ― 」, 言語資源活用ワークショップ2017発表予稿集, pp.143-152 (2017).
References
- Yasuharu Den, Toshinobu Ogiso, Hideki Ogura, Atsushi Yamada, Nobuaki Menematsu, Kiyotaka Uchimoto, Hanae Koiso. The development of an electronic dictionary for morphological analysis and its application to Japanese corpus linguistics, Japanese Linguistics, Vol.22, pp.101-123 (2007). [in Japanese]
- Kikuo Maekawa, Makoto Yamazaki, Takehiko Maruyama, Masaya Yamaguchi, Hideki Ogura, Wakako Kashino, Toshinobu Ogiso, Hanae Koiso and Yasuharu Den. Design, Compilation, and Preliminary Analyses of Balanced Corpus of Contemporary Written Japanese, In Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010), pp.1483-1486 (2010).
現代話し言葉UniDic
現代話し言葉の転記テキストを短単位自動解析するための解析用辞書です。 学習には『日本語日常会話コーパス(CEJC)』を利用しているので、 その転記基準に即したテキストの解析に使用できます。 CEJCの転記基準は以下の文献で確認できます。
この解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。 |
ライセンス |
GPL v2.0/LGPL v2.1/修正BSD | |
参考文献
- 伝 康晴, 小木曽 智信, 小椋 秀樹, 山田 篤, 峯松 信明, 内元 清貴, 小磯 花絵: 「コーパス日本語学のための言語資源:形態素解析用電子化辞書の開発とその応用」, 日本語科学, Vol.22, pp.101-123 (2007).
- 岡 照晃: 「言語研究のための電子化辞書」, コーパスと辞書, 講座 日本語コーパス 7, pp.1-28, 朝倉書店 (2019).
References
- Yasuharu Den, Junpei Nakamura, Toshinobu Ogiso, Hideki Ogura. A Proper Approach to Japanese Morphological Analysis: Dictionary, Model, and Evaluation, In Proceedings of the sixth international conference on Language Resources and Evaluation (LREC 2008), pp.1019-1024 (2008).