Where datameets discovery.
あらゆる発見の基盤となるデータを。
AI開発の基盤となる高品質データを
産み出すソリューションを提供します。
Data Formats
業界・用途に特化したデータフォーマットで、様々なAIデータ課題に対応。
Physical AI
複合データ統合
汎用AI・メタバース
汎用AI・メタバース
Image Data
画像認識・解析
製造業・医療・小売
製造業・医療・小売
Video Data
動画解析・理解
メディア・監視・スポーツ
メディア・監視・スポーツ
3D(LiDAR)
空間認識・測距
自動運転・ロボティクス
自動運転・ロボティクス
NLP
自然言語処理
金融・法務・カスタマーサポート
金融・法務・カスタマーサポート
Audio Data
音声認識・生成
通信・エンターテイメント
通信・エンターテイメント
Improvements
国内外の多様なモデル、ベンチマークに対して精度改善を実現します。
自然言語のみならず、学習用/評価用にさまざまなデータセットを開発しています。
数学推論データセット
LLMの数学推論能力を改善させるデータセット
Benchmark | AIME2025
1
gpt-oss-20b
43.3+10.0
2
Qwen3-32B
36.7+10.1
3
gpt-4o-mini
10.0+6.67
安全性データセット
LLMがより安全な回答を行えるようにするためのデータセット
Benchmark | AIME2025
AnswerCarefully
1
Gemma3-27B
90.18+11.31
2
Qwen3-32B
86.01+9.52
SafeDialBench
1
Gemma3-27B
49.44+15.87
2
Qwen3-32B
44.62+4.71
指示追従データセット
LLMの指示追従性能を改善させるためのデータセット
Benchmark | M-IFEval
1
shisa v2 qwen2.5-32b
58.85+1.44
2
deepcogito v1-preview qwen-32B
60.73+1.22
Services
お客様のご要望に応じて、プラットフォーム提供から個別開発までお選びいただけます。
AI Data Platform
SaaS
PlatformとCloud workerを活用し、
自社内でアノテーションを実現。
自社内でアノテーションを実現。
クラウドワーカーを活用した
データ収集&アノテーション
データ収集&アノテーション
自然言語 | 画像/動画 | 音声
自社リソースを活用した
データ収集&アノテーション
データ収集&アノテーション
自然言語 | 画像/動画 | 音声
AI Data Platform
専門家の知見を活用したAIデータ生成・
管理プラットフォーム。
管理プラットフォーム。
AI Solutions
ソリューション受託開発
データ収集からモデル開発・
システム構築まで、専門チームが対応
システム構築まで、専門チームが対応
複雑なデータ収集や
アノテーション
アノテーション
自然言語 | 画像/動画 | 音声
受託開発
AI開発 | システム開発
RAG開発 | LLM開発
RAG開発 | LLM開発
AI Datasets
ダウンロード形式
すぐにAI開発を始めたい企業向け。
高品質な既製データセットを販売。
高品質な既製データセットを販売。
画像/動画
医療 | インフラ | 食品
...etc
...etc
音声
会話データ | エンジン音
...etc
...etc
自然言語
LLM用
Instruction Tuning
Instruction Tuning
Case Studies
生成AI基盤開発支援、大規模なデータ収集、共同研究、ロボティクス開発支援まで
国内外の伴走事例を紹介いたします。
衛星データを用いて世界中の不動産を一括検索。『WHERE』が叶える未来とは。
物体検出用の教師データ作成 / アノテーションで利用。harBestプラットフォームを利用してAI開発の加速に成功。 この記事でわかること ・衛星画像 × AI プロジェクトの課題感と解決策・アノテーションデータのクオリティコントロールの重要性 今回は宇宙から不動産の課題を解決することをビジョンに掲げているJAXA発のスタートアップ企業、株式会社Penetratorの今川さんにお話を伺いました。 まずは御社の事業概要を伺ってもよろしいでしょうか。 Penetratorは、JAXA発で宇宙からAIで価値のある不動産見つける「WHERE」というプロダクトを作っています。 家を建てたり、建物を建てるときにはまず所有者から直接土地を仕入れる必要があります。この土地の仕入れという業務は、不動産ビジネスの最も源流になる、すごく重要な仕事です。 一方で多くの不動産会社さんが今でも人脈というレガシーの手法を頼っているので優良な土地の仕入れはすごく難しいです。 さらにその人脈のネットワークを閉じているので、なかなか表に情報が出てこないという課題があります。そういった情報を掘り起こすために不動産営業マンが土地探し、土地調査というものを行います。 土地探しはすごい体力仕事ですし、土地調査自体は法務局に何回も行って書類を求めて煩雑業務に追われて、大体100件の営業リストを作るのに30時間かかります。 この課題を解決するヒントになったのが、私自身がJAXAで行っていた研究でした。 月の衛星データからクレーターをAIで解析するといった研究です。「月」から「地球」に、「クレーター」から「不動産」に、応用範囲を変えて応用できないかと思ったのが『WHERE』開発の最初のきっかけです。 具体的にはどのようなプロダクトでしょうか。 ソリューションとしては非常にシンプルなもので、地球の衛星データから AI で空き地、畑、空き家候補、そういったものをピックアップすることができます。さらにその場所の法務局の所有者データと紐づいているので、すぐに所有者情報が出てきて所有者にもすぐにアプローチができるといった特徴があります。 こういった部分のObject Detectionのアノテーションをお願いしている、という状況です。今は AI で広く様々なものを見つけて、そこからまた別の AI でユーザーが求める土地をレコメンデーションができるようなロジックになっています。 今川さんの経歴をお伺いしてもよろしいでしょうか。 はい。大学時代は AI...
放送局の裏側でAI開発に着手。会社全体に拡げるべく、まず私ができること―—。
テレビ局の放映システムや動画解析に携わってきた開発者による、AIでの異常検知に向けた取り組み。 この記事でわかること ・異常検知AIの開発におけるデータセットの利用方法・エンタメ業界 × AIプロジェクトの立ち上げヒストリー 今回は生成AIを活用したシステム構築でアイデアコンテスト受賞歴のある、株式会社フジミックの川島さんにお話を伺いました。 よろしくお願いいたします。まず簡単に御社の事業内容についてお聞かせください。 テレビ局の業務システム、基幹システムの開発・運用や、コンテンツの作成をしています。テレビ画面に映されるテロップ(字幕)をつけるなど、間接的に番組制作にも携わっています。 これまで川島様が携わったお仕事について教えてください。 新卒の頃、テレビ関係の仕事はやっていなかったんです。最初はJH(日本道路公団)様のウェブサイトや、カメラ・フィルム関連企業様のオンラインプリント開発に携わっていました。その後色々なシステム開発、WEB開発を経て、ようやくテレビの基幹システム開発に戻ってきました。うちの会社には、テレビに関わるシステムに興味があって入ってくる人が多いのですが、実は私はあまり興味がなく、ミーハーだったので、バラエティーやドラマ、スポーツ番組を作ることに興味があったんですよね。テレビに出られると思ったのですが、そんなことはなかったですね(笑)。 AIとはどのように接点を持ったのでしょうか。 2015年にその当時あった社長室企画部に兼務でジョインしました。今までやっていないことを色々やってみようという感じで、当時は画像認識やディープラーニングが研究施設だけではなく、企業でもできるようになってきた時代でした。テレビでの画像分類をやってみたり、日本IBM様のユーザー研究会に所属していたので、そこでは複数の単語を入れるだけでメール文が作れるという論文を書いたりと、今でいう自然言語処理的なテクノロジーですね。当時はまだ自然言語そのものを扱うのはまだまだこれからだという認識でした。 本業のテレビ関係のシステムとAIが徐々に絡み合っていったのですね。 テレビ局では私のように一人で多種多様な面白いことにチャレンジしている方が多いように感じていました。たまたま年末の納会でテレビ局の方と話している時に、番組の出演者の顔認識と出演時間をディープラーニングで解析・可視化したいという人がいて、2019年頃からテレビ局の方とAIに関する連携とPoCによるプロトタイプ開発が始まりました。 弊社のサービス「harBest」との出会いですが、3月の「AI博覧会」でしょうか。 そうですね。2023年の秋頃、社内で生成AI活用プロジェクトが始まりました。その立ち上げメンバーに選んでいただいて、AI開発を進めていく中での課題を計画書にまとめているところでした。 AI博覧会の日は、ちょうど客先に向かう途中に気分転換でふらっと寄ってみました。「AIで何かしら形になる成果や結果を残したい」とずっと思っていたこともあり、1時間ぐらい見ようと思って立ち寄りました。しかし、会場に入ったら大変混雑していて。早く出ないと、次のお客さんとの打ち合わせにも間に合わないし。お昼ご飯も食べられないし…と急いでいた時にばったり出会ってしまったんですよね(笑)。 最後の最後で、私たちのブースにお立ち寄りいただいたのですね。 まんまと捕まってしまいまして、気付いたら20~30分程話し込んでいました。その結果、お昼ご飯食べる時間は無くなってしまいましたが(笑)。 その時、今回受賞されたプロジェクトの話をされていたように記憶しておりますが、何かAI開発にかかわるデータを探されていたのでしょうか。 自分で画像データを探すにしても、何が必要なのかというのもイマイチよくわかりませんでしたし、正直「精度上がらないでしょ」と諦めていたのです。場所を選定して、自分で撮影して、自分で切り出して、と一つ一つやらないと精度上がらないだろうなと思っていました。大変だからまず(APTO様で)入手してから考えるのもアリかと。で、実際に購入して、モデルを作って、実際の道路で撮影して推論させてみたのです。そうしたら「ひび(クラック)」や「穴(ポットホール)」もちゃんと検知してくれたので調子づいちゃいました(笑)。 実際に「ポットホールのデータセット」を使ってみていかがでしたか。 PoCやコンテストに出すとなると、正常なデータも必要となり、そちらは後から自分で画像を集めました。本件に関しては、色々と教えていただいたことで、あれもこれもデータセットになるのだという気づきをもらいましたね。 その後は家の近くの新しくできたコインパーキングで、綺麗なアスファルトの画像データ収集なんかもしました。データ収集中は「怪しい変なおじさん」になっていましたが、「データセットはこういう感じでいいのだ」という新たな発見とアイデアをもらえて面白かったですね。今更かもしれませんが、悩むより行動することが大切ということが身に染みました。 弊社とのコミュニケーションはいかがでしたか。 私自身そんなデータのことについてよくわかっていなかったので、「データの形式は何がいいですか?」と聞かれても、正直何でもいいのだけど、とか思っていたのですけど、色々と気軽に対応してもらえてすごく助かりました。今後アノテーションについても時間があれば試してみたいです。 また、新たなプロジェクトに挑まれると伺いました。お聞かせ願える範囲で教えていただけませんか。 今、LLMファインチューニングするためのインストラクションデータに大変興味があります。生成AIのすごいところは、コンテンツを一つひとつ手作りしなくても簡単に作れるところですよね。それを使って、AIによる実況や裏話が聞けるコンテンツを作りたいです。そうしたらエンタメコンテンツの楽しみ方に幅が出てくるなと思っておりまして。 是非、お力添えさせてください。本日はたくさんのお話を聞かせていただきありがとうございました。私たちもアップデートを重ねて参りますので、引き続き「harBest」をよろしくお願いいたします!
AIデータを活用して効率的な帳票管理を実現。『PATPOST(パットポスト)』の成功の秘訣。
御社の事業概要を教えてください。 オリックスグループは、法人金融、産業/ICT機器、環境エネルギー、自動車関連、不動産関連、事業投資・コンセッション、銀行、生命保険など多角的に事業を展開する企業グループです。その中で私はオリックス(株)デジタル戦略推進室という部署に所属しておりまして、デジタル技術を活用した新しいサービスの提供を行っています。 中でも、2023年5月にリリースした『PATPOST(パットポスト)』というサービスにメインで関わっていまして、先日ローンチから1周年を迎えました。2024年7月現在、1500社強(無料アカウント期間も含む)のお客さまにご利用いただいております。 ありがとうございます。奥田さんの経歴について、お伺いしてもよろしいでしょうか。 新卒採用で2018年に入社して、現在7年目になります。営業から始めて、現在の部署に移りました。異動後、 2023年10月にインボイス制度 の開始や、2024年1月1日に電子帳簿保存法の電子取引データ保存の完全義務化が予定される中で 中小企業の経理担当者の負担となる書類管理業務の効率化を目指した課題解決ソリューションを作ろうということで 今のPATPOSTの担当者として従事するようになりました 。 『PATPOST(パットポスト)』とはどういったサービスでしょうか? 主に経理担当者向けのサービスで、「電子帳簿保存法 の電子取引データ保存の要件※1」および「インボイス制度 」対応を効率化するオンライン文書管理ストレージサービスです。※別途、訂正・削除防止に関する事務処理規程の制定・遵守が必要帳票をアップロードするだけで、AI-OCR が帳票内の必要な情報を自動抽出してくれます。他社のサービスは従量課金が一般的な中、容量無制限※2で税抜月額980円 /1ID(契約期間は1年。3IDから)という料金設定が多くの皆さまにご好評いただいております。※1IDあたり年間12,000カウント相当のファイル数をアップロード可能。アカウントに対して、契約ID数×12,000カウント(年間)付与。カウント数の上限を超えてファイルをアップロードする場合は、契約IDを追加する仕様 そこで「AI」が出てくるんですね。当社のツール「harBest」とはどのように出会われたのでしょうか。 もともと『PATPOST』の開発時から、複数のアノテーション会社に「教師データ」や「位置情報付きデータ作成」を依頼していました。しかしながら、なかなか期待通りのアノテーション成果物や精度の向上につながらなかったんですね。そこで、弊社のメンバーがアクセラレーションプログラムか何かでAPTOさんと出会って、私たちの部署のデジタルソリューション開発周りのメンバーに紹介してくれたんです。 なるほど。部署間のコミュニケーションが活発なんですね。 風通しのいい文化ではありますね。スピーディに高品質なデータ収集・作成ができるツールということで紹介してもらって、とりあえず連絡してみようと。で、オリックスの要望を伝えたところやっていただけることになりました。APTOさん の「何でもやります!」という前向きな姿勢がすごくよかったのと、料金設定も適切なものだと感じまして、結果として効率的なデータ処理を実現することができました。 どういった内容のプロジェクトだったんでしょうか。 「PATPOST」は請求書に代表されるような文書データの処理を効率化するツールなんですが、より多種多様な項目抽出 を行うためには、多種多様な請求書のテンプレートが必要でした。中でも海外の請求書や領収書など収集が難しいカテゴリーに関しても、「harBest」を使うことで効率的な収集・アノテーションが実現できたと感じています。 「harBest」はデータ収集・アノテーションにクラウドワーカーを活用していますが、スピードや量的な面でお力添えできたということでしょうか。 そうですね、APTOさんとのコミュニケーションにおいては納品の際のやりとりや、今後よりデータを活用するためのデータ収集方法のご助言までいただけて、非常に満足しています。次回以降は、項目の定義をより厳密にすることで、さらにソリューションの精度を高めていきたいと考えています。 ありがとうございます。最後に、今後のビジョンや目標について教えてください。 今後も「PATPOST」のシンプルな設計を維持しつつ 、 最新のAI技術も取り入れていきたいと考えています...
Use Cases
課題に応じたソリューション提案をオンデマンドで実装いたします。
LLM/SFT/RLHF
Agent
RAG
Eval
Physical AI
物体検出
音声認識
Events & Insights
最新R&D事例、学会等のイベント登壇情報はこちらから。
Upcoming Events
Expert Insights
データで、
革新のきっかけを。
APTOの高品質AIデータで、あなたのビジネスに新たな可能性を。
まずは資料請求からお気軽にお問い合わせください。


