自社で AI proxy を運用してわかったこと

私たちは、アプリから大規模言語モデル（LLM）を安全に使うために、自社で AI proxy サーバを構築・運用しています。本番で動かす中で見えてきた設計の勘所を、技術ブログとして共有します。

なぜアプリから直接 LLM を呼ばないのか

LLM の API キーをアプリに埋め込んで直接呼び出す、というのは避けるべき設計です。アプリのバイナリは解析され得るため、鍵が漏れれば誰でも課金を悪用できてしまうからです。

そこで、アプリと LLM のあいだに自社の proxy を挟みます。鍵は proxy サーバ側だけが持ち、アプリは proxy に話しかける。これだけで、鍵の保護・利用制御・ログ管理を一元化できます。

proxy を置く最大の利点は、リクエストを受ける入口で検証できることです。私たちの構成では、Apple が発行する購入レシート（JWS 署名）を proxy 側で検証し、正規にサブスクリプションを購入したユーザーのリクエストにのみ応答します。

これにより、

といった制御が、アプリを更新しなくても行えるようになります。

AI を扱ううえで私たちが徹底しているのは、実際に動いているものだけを訴求するという姿勢です。「AI が補足説明します」とうたうなら、本物の LLM が裏で動いていなければならない。テンプレートを返すだけの“なんちゃって AI”を AI と称することはしません。

医療に近い領域では、この線引きはとりわけ重要です。誇張のない実装と、正直な説明。AI proxy の運用は、その原則を技術として体現する取り組みでもあります。

関連キーワード（AI 抽出）: #LLM #AI proxy #セキュリティ #アプリ開発

医療 × ICT × AI のご相談はこちら

記事に関連するご相談も歓迎です。お気軽にお問い合わせください。