Apertium
最新版 | 3.3.2 / 2016年1月2日 |
---|---|
リポジトリ | |
プログラミング 言語 | C++ |
対応OS | POSIX互換 |
対応言語 | 多言語 |
種別 | 機械翻訳 |
ライセンス | GNU General Public License |
公式サイト | www.apertium.org |
Apertiumは、スペイン政府とカタルーニャ州政府がアリカンテ大学に資金援助して開発されている機械翻訳プラットフォーム。フリーソフトウェアであり、GNU General Public License でリリースされている。
もともとはOpenTradというプロジェクトの一環として開発され始めた複数の機械翻訳エンジンの1つであり、言語的に近い言語間での翻訳向けに設計されていた。その後、もっと離れた言語間の翻訳も扱うよう拡張されてきた。新たな言語を対象として加えるには、言語データ(辞書、ルールなど)を既定のXMLフォーマットで作成すればよい。
言語データ作成には、ビーゴ大学、カタルーニャ工科大学、ポンペウ・ファブラ大学が協力している。既に(安定版で)言語データが作成済みの言語としては、バスク語、ブルトン語、カタルーニャ語、英語、エスペラント、フランス語、ガリシア語、アイスランド語、オック語、ポルトガル語、ルーマニア語、スペイン語、ウェールズ語がある。今ではいくつかの企業もApertium開発に参加している(Prompsit Language Engineering、Imaxin Software、Eleka Ingeniaritza Linguistikoa など)。
Apertiumは「浅い」機械翻訳システムであり、有限状態トランスデューサを使って語彙の変換を行い、隠れマルコフモデルを使って品詞タグ付けや単語カテゴリの曖昧さの処理を行う。言語の組合せによっては(例えば、ブルトン語とフランス語)制約文法タグ付け器も使うことがある。
2009年の Google Summer of Code では9プロジェクトが採用された[1]。
脚注・出典
[編集]参考文献
[編集]- Corbí-Bellot, M. et al. (2005) "An open-source shallow-transfer machine translation engine for the romance languages of Spain" in Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, pp. 79–86
- Armentano-Oller, C. et al. (2006) "Open-source Portuguese-Spanish machine translation" in Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], p 50-59.
関連項目
[編集]関連文献
[編集]- Alberto Simões; Xavier Gómez Guinovart; José João Almeida. "Editorial ". . Linguamática, v1. 2009.
- Bartosz Jarmuż. Machine Translation Development of an experimental machine translation system based on Apertium engine. 電子書籍 OCLC 863875547. . Saarbrücken : LAP LAMBERT Academic Publishing, 2012.
- Alexia Bos i Solé; Miquel Strubell i Trueta. Les fronteres del multilinguisme : una visio actual i pluridisciplinar sobre el multilinguisme en la societat contemporania . 電子書籍 OCLC 902819849. . Barcelona : Editorial UOC, abril 2013.
- Fernand De Varennes; Mikel L Forcada; Jeremy Evas. Les fronteres del multilingüisme : una visió actual i pluridisciplinar sobre el multilingüisme en la societat contemporània. 電子書籍 OCLC 829432099. . Barcelona : Editorial UOC, 2013.
- Adam Przepiórkowski; Maciej Piasecki; Krzysztof Jassem; Piotr Fuglewicz. Computational Linguistics : Applications 電子書籍 OCLC 1010679169. . Berlin, Heidelberg : Springer Berlin Heidelberg, 2013.
- Aida Sundetova; Aidana Karibayeva; Ualsher Tukeyev. "Structural Transfer Rules for Kazakh-to-English Machine Translation in the Free/Open-source Platform Apertium." . Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, v2 n7: 48-53. 2014-12-21.
- Mireia Ginestí Rossell; Mikel L. Forcada Zubizarreta . "La traducció automàtica en la pràctica: aplicacions, dificultats i estratègies de desenvolupament." . Caplletra: Revista Internacional de Filologia, n46: 43-60. 2014.
- Sánchez-Cartagena Víctor M.; Pérez-Ortiz Juan Antonio; Sánchez-Martínez Felipe. "RuLearn: an Open-source Toolkit for the Automatic Inference of Shallow-transfer Rules for Machine Translation." . Prague Bulletin of Mathematical Linguistics, v106 n1: 193-204. 2016.
- Víctor M. Sánchez-Cartagena; Juan Antonio Pérez-Ortiz; Felipe Sánchez-Martínez. "RuLearn: an Open-source Toolkit for the Automatic Inference of Shallow-transfer Rules for Machine Translation". The Prague Bulletin of Mathematical Linguistics, v106, n1: 193-204. 2016-10-15.
- Gianfranco Fronteddu; Hèctor Alòs i Font; Francis M. Tyers. "Machine translation from Catalan to Sardinian: a translation tool for a language in the process of standardisation." . Linguamática, v9, 2017.
- Mikel L. Forcada. "Apertium: traducció automàtica de codi obert per a les llengües romàniques". . Linguamática, v1, 2018-04-30.