HyperAI超神経
Back to Headlines

古代文献の自動転写技術:倫理的な労働実践を目指して このタイトルはシンプルで簡潔であり、同時にテクノロジーのマニアにとって魅力的な要素を含んでいます。また、ニュース本来の意図である古代文献の自動転写技術とその倫理的な側面を適切に表現しています。ニュースのコアインフォメーションも正しく反映されています。

1日前

機械学習を活用した早期近代文書の自動転写と倫理的な労働 マスデジタル化は過去20年間で学術研究の領域を大きく変革しました。デジタル転写された資料から特定のキーワードを検索できるようになったことで、時間を大幅に節約でき、学者たちは文献を精査するために必ずしもアーカイブや図書館に足を運ぶ必要がないようになりました。しかし、デジタル転写の普及 junto に新たな課題が台頭しています。特に、これに伴う労働条件についての懸念が浮上しています。 セルナー・ストレッカーとキムバリー・リフトンが『セイストゥサーティン・センチュリー・ジャーナル』で発表した最新の研究では、早期近代の印刷物をデジタル化し、転写を取得する方法と、倫理的な労働実践を避ける方法を提案しています。「早期近代印刷物のデジタル化アーカイブの解錠: 早期近代の印刷物の自動転写」では、転写ソフトウェアの2種類、光学的文字認識(OCR)と手書き文字認識(HTR)の歴史を簡単に説明しています。 OCRは19世紀後半と20世紀の作品の転記に適していますが、早期近代の印刷物の特有の不規則性により、信頼できる転写には不十分です。そこで、早期近代の学者たちはHTRテクノロジーに注目しています。HTRの主要ソフトウェアであるトランスクリバス(Transkribus)を使えば、公開されている転写モデルを利用したり、独自のモデルをトレーニングすることができます。ストレッカーとリフトンは、16世紀の例集選択ページのHTRモデルを比較検討し、トランスクリバスが単純な5ステップで目的通りのモデル作成を可能にする点を強調しています。 トランスクリバスの公開モデルを用いて、研究者は自分たちのハイアキュラシーモデルのトレーニングデータを作成できます。彼らはこのプロセスが「外部労働、特に大学院生やグローバルサウスの労働者への依存を必要とせず、また望ましくない」と主張しています。 早期近代の研究分野における自動転写は、既に現実のものとなりました。ストレッカーとリフトンは、「学者たちは人間の労働と機械学習技術の組み合わせをどのように受け入れ、支援するかを検討しなければならない」と結論付けています。そして、「倫理的な労働慣行を重んじることによってのみ、学者たちは学術界的な格差の悪化や植民地主義の持続的な不平等を引き起こすことなく、研究の未来を形づくることができる」と述べています。 より詳しい情報については、研究論文を参照ください: - Serena Strecker et al, "Unlocking the Digitized Archive of Early Modern Print: The Automatic Transcription of Early Modern Printed Books," The Sixteenth Century Journal (2025). DOI: 10.1086/735052

Related Links