Twitterで「Word TeX」と検索していたら、「Mosha」というサービスがあることを知りました。
この「Mosha」というサービスは凄いサービスです。
どのようなサービスかというと、画像の中の文字や数式をWord形式やTeX形式に変換出来るというサービスです。日本語・英語のOCR(光学文字認識、optical character recognition)機能が備わっています。
Mosha Cloud SpotOCR
1分ほどの簡単な登録をするだけで、無料で使用で来ます。
流れは以下の通りです。
- 出力したい数式・文章のスクリーンショットをとる
- MoshaのSpotOCRからスクリーンショットファイルを選択して送信
- TeXやWordやMathML形式でダウンロードできる
Moshaに登録してみる
まずは、公式ページにアクセスします。
Mosha Cloud SpotOCR
▲初めて利用する場合は、右上の新規登録から。
▲アカウントを作成します。
- ユーザー名
- メールアドレス
- パスワード
を入力したら登録を選択します。
▲登録が完了すると、メールが届きます。
▲メールにあるリンクをクリックする事で、アカウントを確認します。
▲アカウントが確認できました。それでは早速利用してみます。
実際にMoshaを利用して数式入りの画像をWord・TeX・MathML形式に出力してみる
それでは実際に数式入野画像をWord・TeX形式に出力してみましょう。
まずは素材を用意します。
▲TeX形式に出力したい画像を「拡大表示して」スクリーンショットで保存します。Macの場合は、「command+shift+4」のショートカットキーを押すと撮影できます。
▲続いて、MoshaのSpotOCRを選択し、ファイルを選択します。
▲ファイルを選択し終わったら、図の送信を選択します。すると、アップロードが始まります。
▲アップロードが完了すると、
- TeXコマンド(編集可能)
- TeXコンパイル(プレビュー)
- ダウンロード(各種形式)
が表示されます。
精度が高い変換です。今回の場合だと正しく変換が行われました。
ただ、変換が一部うまくいかない場合もあるかもしれません。そんな時には、TeXコマンド部分で編集できます。間違っている所を修正することが出来ます。
また、ダウンロード部分では保存が出来るように思いましたが、ここからは出来ませんでした。以下で説明する「履歴」から、それぞれの形式でダウンロードできます。
▲「履歴」を選択すると、これまでにアップロードしたスクリーンショットの一覧が表示されます。そして、それぞれの形式ファイルもダウンロードできるようになっています。
「編集済みTeX」と「TeX」の違いは、
- 編集済みTeX・・・TeXコマンドで修正後のコマンド
- TeX・・・・・・・スクリーンショット画像からの変換によるコマンド
です。修正した場合は、「編集済みTeX」をダウンロードしましょう。
それぞれのファイル形式をダウンロードして開いてみる
それぞれのファイル形式を開いてみます。
▲TeX形式のファイルを開いてみると、
▲ご覧のようなコマンドです。
▲docファイル(Word)を開いてみると、
▲ご覧のような数式が表示されました。
▲MathMLファイルは、Safari7.0.2でダウンロードしました。このファイルをweb上に埋め込めば、MathML対応ブラウザのFirefoxやSafari上では、数式が表示されます。Google ChromeはMathML形式に非対応です。
webでちょっとした数式を使用したい時にはMathML形式のファイルが活躍しますね。
文章&数式一緒に可能
先ほどは数式を入れた画像しか紹介しませんでした。
しかし、きちんと文字・数式が大きければ、文章&数式でも可能です。
以下の画像もアップロードしてみました。
▲文章と数式入りの画像を送信してみました。
▲すると、なんなく変換できました。
▲修正する必要がありません。凄い。。。履歴からTeXファイルを開いてみます。
▲documentclassと開始終了コマンドを入力して、ファイル名を18文字以内に変更(スクリーンショットのファイル名が18文字以上だとTeXShop 2013ではエラーが出た)して、コンパイルしてみると、
▲ご覧のようになりました。画像と同じような形式で表示できています。数式番号を入れたい場合は、個別に修正が必要ですね。奇数番目の$$をbegin{equation}、偶数番目の$$をend{equation}に置換すれば、数式番号を表示できそうです。
備考
シグマ(Σ、和集合)の添字が上に表示されるようにしたかったので、個別に修正しました。参考にした記事は以下の記事です。
Texで総和(summation)を表すシグマの上付き下付き文字がちゃんと上と下にいかない時は – MY ENIGMA
▲\sum x_{a}^{b}を\displaystyle \sum x_{a}^{b}}へ変更してみました。
▲その結果が、こちらです。綺麗に表示できました。
今回の場合だと、元画像が、シグマの添字が右に表示されていたのでやむを得ません。Moshaは添字の配置まできちんと反映してくれるという事です。
まとめ
画像内に表示されている文章がデータ化されるので、画期的なwebサービスです。実験レポートや論文を書く時に役に立つwebサービスです。学生は注目ですね。
また、文章も扱えるので、数式を扱わない人でも役に立つ場面が多いでしょう。
それにしても画像内に表示されている文章や数式がデータ化されるってすごいなぁ。。。これはすごい。。。
参考:Mosha Cloud SpotOCR
コメント