DeepLを超えるやさしい翻訳アプリとGPTsを作りました
苦手な分野の英文を理解するのを助けてくれます。
なぜ翻訳アプリを作ったのか
私は最近ChatGPTのような大規模言語モデルに興味があり、AI開発者の方や、大規模言語モデル関連の情報を発信している方をフォローしていました。
すると最新の論文(英語)や英語のツイートが次々に流れてくるのですが、それらをGoogle翻訳したり、DeepLで翻訳しても、意味不明な場合が多いということに気づきました。
特に海外の方の1行だけのツイートなどは、DeepLで翻訳しても全く意味がわからない場合が多くて困っていました。
AI関連の論文は専門用語が多く、いちいち調べながら読んでいると、1日の大半の時間が情報収集だけで終わってしまいます。
これは要するに「自分の専門分野でない分野の英文を理解するのは大変」ということなので、例えば「Web制作初心者の方が海外のWebサイトを読んだり、プログラミングに慣れていない方が英語の公式ドキュメントを読む場合でも、同じように苦労しているのではないか?」と考えました。
そこで、難解な英文を解説付きの分かりやすい日本語に翻訳する「誰でも使えるWebアプリ形式」と「ChatGPT Plusユーザの方向けのGPTs」を一般公開しました。
「一般向け(Web制作、プログラミング、そのほか様々な分野の翻訳に対応)」と、「AI関連に特化」の2種類に分けています。
翻訳例
原文は NVIDIAのJim Fan氏のツイート より。この文章にある “free” は無料ではなく「自由」という意味なので、Google翻訳は明らかに間違えています。
原文は「GPT-4をMinecraftで自由に行動させたらどうなる?」という意味なので、DeepLの翻訳は「マインクラフトで」と「GPT-4を」を逆にした方が良いと思います。
上記スクショで4番目の「GPT-4による翻訳」は、「以下の文章を日本語に翻訳してください」というシンプルなプロンプトによるものです。
先程の原文を、今回制作したWebアプリまたはGPTsで翻訳すると、この画像全体の文章が出てきました。単に翻訳するだけでなく、わかりやすい補足も入れて理解を助けてくれます。
原文: [2310.01334] Merge, Then Compress: Demystify Efficient SMoE with Hints from Its Routing Policy (このページの見出しと、Sparsely activated から始まる本文のテキスト)
ロールプレイ翻訳
※以下の翻訳例は、最終的な翻訳結果だけでなく、このWebアプリから出力される全てのテキストのコピーです。最終的な翻訳文は、以下の「世界最高の編集者:」以降の太字部分です。
AI研究者:
このテキストに出てくる「Sparsely activated Mixture-of-Experts (SMoE)」は、ニューラルネットワークの学習能力を拡大する有望な方法ですが、「専門家」としての複数のネットワーク層のコピーを作ることによる高いメモリ使用量や専門家間の冗長性という問題があります。「ルーティングポリシー」とは、データがどの専門家に送られるかを決定する方針のことですが、これがうまく機能しないと専門家間で似たような機能が重複し、非効率になることを指しています。この論文では、メモリの効率を上げてスケーラビリティを向上させる方法を模索しています。提案されている「M-SMoE」は、専門家を統合する際に、それぞれの専門家がどれだけ活性化されているかの統計情報を利用し、必要な情報を保持しつつ、不必要な専門家の影響を減らして統合していく手法です。さらに「MC-SMoE」は、統合された専門家の情報を圧縮することで、メモリ消費を大幅に減らしながらも性能を維持するというアプローチを取っています。
プロの翻訳家:
「専門家の組み合わせ、それから圧縮:効率的なSMoEの謎解きにヒントを得る」
スパース活性化混合専門家モデル(SMoE)は、ニューラルネットワークの学習能力を拡大する可能性を示していますが、(a)複数の専門家へのネットワーク層の複製による高メモリ使用量、および(b)共通の学習に基づいたルーティングポリシーによる専門家間の冗長性の問題を抱えています。したがって、従来のSMoEモデルはメモリ効率が悪く、特にリソースに制約のある下流のシナリオでは拡張性にかけます。本論文では、専門家情報を統合してコンパクトなSMoEモデルを作ることは可能か? 複数の専門家をより少なく、しかしより知見のある専門家に統合する最良の方法は何か? 私たちの事前調査は、従来のモデル統合方法がSMoEの専門家の統合に効果的でないことを明らかにしました。その潜在的な理由は:(1)余分な情報が重要な専門家を覆い隠す、(2)専門家を整列させるための適切なニューロン順序の欠如です。これに対処するために、私たちはルーティングの統計情報を活用して専門家を統合する M-SMoEを提案します。具体的には、専門家のニューロン順序の整列から始め、支配的な専門家とその「グループメンバー」を形成し、最後に各専門家グループを専門家の活性化頻度を統合のウェイトとして利用して1つの専門家に統合します。これにより、重要でない専門家の影響を低減します。さらに、提案された統合によって統合専門家のウェイトスペースの次元が自然に低減されることが観察されました。このため、最終的な手法であるMC-SMoE(つまり、統合してから圧縮するSMoE)では、統合された専門家を低ランクおよび構造的にスパースな代替物に分解し追加の圧縮を実現します。8つのベンチマークでの広範な実験により、MC-SMoEの有効性が検証されました。たとえば、私たちのMC-SMoEは最大80%のメモリ削減と20%のFLOPs削減を実現し、実際上性能の損失はありません。
初心者:
「ニューロン順序の整列」「グループメンバー」「ウェイトスペースの次元」などの表現がよく分からないです。
AI研究者:
「ニューロン順序の整列」とは、複数ある専門家のニューロン(人工ニューラルネットワークの基本単位)を同じ順番に並べることで、統合しやすくすることです。また「グループメンバー」というのは、統合される専門家の中で似たもの同士をグループ化することを意味します。「ウェイトスペースの次元」とは、専門家が持つパラメータの集合の大きさ、いわば複雑さの度合いを指し、次元が低いということは、より単純で圧縮しやすいことを示しています。
水平思考のクリエイター:
「ニューロン順序の整列」を「専門家たちの知識の並べ替え」、「グループメンバー」を「似た専門家のチーム」、「ウェイトスペースの次元」を「専門家の知識の広がり」など、もう少し身近な言葉やイメージに置き換えて説明するのがいいかもしれません。
世界最高の心理学者:
この文章は技術的な効率と性能を改善するための具体的な方法を提案することに焦点を当てています。ここで言っている「専門家の統合」というのは、個別の専門能力を持つ部分を統一して全体の効率を上げるためのメタファーかもしれません。また「余分な情報が重要な専門家を覆い隠す」は、実用的な情報を見つけ出す際の障壁を意味していると言えるでしょう。それを克服する方法についても言及しています。
世界最高の編集者:
「専門家を統一し、その後圧縮する:効率的なSMoEモデルを理解しやすくする」
あまり使われていない混合専門家モデル(SMoE)は、ニューラルネットワークの学習能力を増大させる有望な手法です。しかし、(a)複数の専門家へのネットワーク層の複製に伴うメモリ使用の増大、(b)専門家の冗長性による効率性の低下が問題となっています。本研究では、専門家の情報統一により、コンパクトで効率的なSMoEモデルを実現できるかを探りました。具体的には、専門家たちの知識を同じ基準で並べ、知識が豊富な専門家とその仲間を一つにまとめ、そしてそれぞれの専門家がどれだけ活動しているかに基づいて統合する手法を提案します。これにより、重要ではない専門家の影響力が減ると同時に、専門家の知識の広がりが自然と小さくなりますので、これをさらに圧縮することが可能です。これが、私たちの「統合してから圧縮するSMoE」、つまりMC-SMoEです。複数のベンチマークでのテストを通じて、このMC-SMoEはメモリ使用量を最大80%削減し、計算量を20%減少させつつ、性能をほとんど落とさないことを検証しました。[END]
Web Content Accessibility Guidelines (WCAG) 2.0 より
原文: 2.4.1 Bypass Blocks: A mechanism is available to bypass blocks of content that are repeated on multiple Web pages. (Level A)
専門家: この文は、ウェブアクセシビリティに関するガイドラインの一部です。特に、ユーザーが複数のウェブページにわたって繰り返されるコンテンツブロックをバイパス(回避)するためのメカニズムを提供することが求められているレベルAの基準について述べています。ここで言う「バイパスするメカニズム」とは、例えば、ナビゲーションメニューをスキップして本文に直接進むことができるリンクなどのことを指します。
プロの翻訳家: 2.4.1 コンテンツブロックをバイパスする: 複数のウェブページに繰り返されるコンテンツブロックを回避するためのメカニズムが用意されている。(レベルA)
初心者: 「コンテンツブロックをバイパスする」という表現がどういう意味なのか、もう少し分かりやすく説明してほしいです。
専門家: 「コンテンツブロックをバイパスする」とは、ウェブサイトを利用する際に、毎回同じ内容(例えば、ヘッダーやナビゲーションメニューなど)を読み飛ばして、直接興味のある本文などの情報にアクセスできるようにすることを意味します。これにより、特にスクリーンリーダーを使用している視覚障害のあるユーザーが、情報により速やかにアクセスできるようになります。
水平思考のクリエイター: このガイドラインをもっと具体的な例を挙げて説明すると、ユーザーが「このページのメインコンテンツにスキップする」ようなリンクをクリックすることで、すぐに本文にアクセスできるというイメージです。これは、情報への迅速なアクセスを促進し、ユーザビリティを向上させるための工夫です。
世界最高の編集者: 2.4.1 コンテンツブロックを回避する: ユーザーが複数のページに渡って繰り返されるコンテンツのブロックをスキップできるようにするための方法が提供されています(レベルA)。
これには、「このページのメインコンテンツに直接進む」などのリンクを設置することが含まれ、特にスクリーンリーダーを利用する視覚障害者が情報に素早くアクセスできるようにするための措置です。[END]
※世界最高の編集者の「(レベルA)。」以降は原文にはありませんが、ユーザーが理解しやすくいるために、文脈を推測して積極的に補足を入れるようにしています。
Webアプリの使い方と解説
Google 翻訳やDeepLなどでは理解しづらい英文をクリップボードにコピーし、「翻訳したい文章」の下のテキスト欄にペーストします。
「翻訳する」ボタンをクリックしてしばらく待つと、右側(スマートフォンでは下側)の翻訳結果の欄にテキストが表示され始めます。
この時翻訳結果を終了して終わりではなく、複数のキャラクターが翻訳元の文章を解説したり、議論している様子が見れます。
登場するキャラクターは以下の通りです。
専門家:専門用語について解説します。
世界一の翻訳家:ここで表示される翻訳文は仮の翻訳だと思ってください。単に「翻訳家」という名前に設定するよりも「プロの翻訳家」や「世界一の翻訳家」とした方が翻訳の品質が上がるため、このような名前にしています。
初心者:翻訳された文章で、難しかったり、理解できなかったところを指摘します。
水平思考のクリエイター:難しい用語をどのように言い換えれば理解しやすいかを考えます。
世界一の心理学者: 原文の意図やニュアンスを推測します。
世界一の編集者:初心者、専門家、クリエイター等の意見をまとめて、最終的な翻訳文を出力します。
※GPT-4が必要ないと判断したキャラは、出てこなかったり、セリフがない場合もあります。
このように翻訳を2段階にして、途中で用語の解説を含めることで、最終的な翻訳文はかなりわかりやすいものになります。
翻訳途中は、出力領域の背景色が薄い灰色になっていますが、翻訳が完了すると背景色が白くなります。
「全体コピー」ボタンをクリックすると出力された文章全体がクリップボードにコピーされます。「コピー」ボタンをクリックすると、世界一の編集者:以降の太字部分のみがコピーされます。
追加の質問または翻訳の修正
翻訳後に新しくテキスト入力欄が出てきます。そこで翻訳された文章でわかりにくいところがあったら質問したり、翻訳内容の修正を求めることができます。
この時、GPT-4のAPIには、元の文章と最終的な翻訳結果のみを履歴として渡します。
元の文章について聞きたい時は「原文にある〇〇の意味を教えてください」、翻訳後の文章について質問したい時は「翻訳後の文章にある〇〇の意味がわかりません」のように質問してみてください。
元の文章と最終的な翻訳結果以外の履歴は渡していないため、「初心者が指摘した〇〇についてですが」などといっても伝わりませんので、ご注意ください。
アプリ版の制限について
アプリ版は期間限定で無料公開しておりましたが、現在はChatGPT公式で無料でGPTsがご利用頂けるようになったため、今後は↓で紹介している「GPTs版」をご利用ください。
ただし、ご自分のOpenAI APIキーを設定してご利用いただく場合は、アプリもご利用頂けます。
翻訳アプリにアクセスする方法
翻訳アプリは、現在メールマガジンにお申し込みいただいた方にURLをお伝えしています。メールマガジンのご登録は以下からどうぞ。
GPTs版の使い方と解説
GPTs版であれば、メールマガジンのお申し込みなしでご利用いただけます。
GPTs版は以下のリンクからアクセスできます。ChatGPT Plus(有料)に登録されている方であれば、どなたでも利用いただけます。
ChatGPT – ロールプレイ翻訳 通常版。Web制作・プログラミングやその他の話題はこちら
ChatGPT – ロールプレイ翻訳(AI研究用) AI関連の話題、生成AIに関する論文、AIに関するツイートなどの翻訳はこちら
※もしログイン画面がずっと表示される場合は、Webブラウザの戻るボタンをクリックしてください。
プロンプト欄に翻訳したい英文だけをペーストしてください。
短文の場合など、英文だけでは文脈がわかりにくい場合、日本語でどのような文脈の文章かを書いていただければ、より正確に翻訳できる場合があります。
翻訳が終わった後に追加の質問がある場合や修正を依頼したい場合、プロンプト欄に書いてください。
最終的な翻訳部分だけをコピーしたい場合は「世界最高の編集者:」以降の太字部分を選択してコピーしてください。
GPTs版のみの機能
URLでWebページやPDFを翻訳
プロンプト欄にURLだけを入力すると、そのページの本文を読み取って翻訳してくれます。
本文が長い場合は要約された文章が翻訳されます。詳細に翻訳したい場合は、翻訳したい部分をコピーしてプロンプト欄に貼り付けた方が良いです。
論文等のPDFのURLも多くの場合、翻訳可能です。
初めてURLを送信した時は、WebPilotにアクセスして良いか尋ねる表示が出てきますので「Always allow…(常に許可する)」ボタンをクリックしてください。
GPTs版の問題
GPTs版は、長文を翻訳している途中でクラッシュしてしまう(出力できなくなり、最初からやり直すしかなくなる)ことがあります。
原文がおおよそ2000文字を超えるとこのような現象が起きやすいため、1度に翻訳するテキストは2000文字以内にした方が良いです。
長文のまま翻訳したい場合は、複数回に分けて翻訳することをお勧めします。
Webアプリ版をご利用の方へお願い
GPT-4 APIの利用料金は高く、この翻訳アプリは、原文の数倍の文章を出力します。そのため、たくさんの方がアプリ版を使用された場合、私の費用負担がかなり大きなものとなってしまい、サービスを終了せざるをえなくなる場合があります。
今まで全く理解できなかった難解な英文が理解できるというのはとても良い体験だと私は思っているので、なるべくこのサービスを持続的なものにするように、以下のようにご協力いただけると幸いです。
GPTs版をご利用ください
ChatGPT Plusを契約されている方は、なるべくGPTs版の利用をお願いいたします。
ご自分のAPIキーをご利用ください
GPT-4のAPIキーが利用できる方は、アプリ版でご自分のAPIキーを設定してご利用いただけると幸いです。
ご自分のAPIキーを利用した場合、1日5回程度の利用であれば、おおよそ月500円以下で収まるはずです。
Amazon欲しいものリストによる寄付をご検討ください
サービス継続のための寄付も受け付けております。現在、Amazon欲しいものリストを公開していますので、以下のページからご注文頂けると幸いです。
このようなAIアプリが必要な方へ
このWebアプリは、FastAPI (Python), JavaScript, SQLite, Microsoft Azureを使用して開発しています。
特定の業界に向けたわかりやすい翻訳アプリが欲しい方はもちろん、ChatGPTのAPIを使用したWebアプリの開発のご相談は、以下のお問い合わせページよりお気軽にご相談ください。
AIによるプログラミング、WordPress、Web制作に興味がある方へ
Web制作の基礎から学べる「Webコーディングスクール」では、AIを活用した効率の良いコーディングやプログラミングが学べます。
スクール独自の「Web制作初心者のために開発したAIアプリ」も使用します。
詳しくは以下のページをご覧ください。