はじめに
デジタルコンテンツ制作の分野において、生成AIを使った2D画像からの3Dモデルの作成は、様々なアイデアを迅速に視覚化するための便利な方法となっています。様々なモデルやサービスが展開されているので、自身の用途に合わせた物を選択することが重要となります。
このブログ記事では、人気の4つのモデル「Tripo」「TripoSR」「InstantMesh」「Meshy」について検証し、それぞれの強みなどを調査したので情報を共有したいと思います。
特徴
生成された3Dモデルのテクスチャ再現度が高く、参照画像にテキストが含まれている場合でも、テキストが読めるレベルで再現を行うことが出来る。
参照画像
Tripo
参照画像の「穴」をうまく処理できる点で他モデルより優れている。
メッシュとテクスチャのクオリティを上げる後処理が提供されており、料金と処理時間が追加で発生するがモデル全体のクオリティを向上させることが可能。
参照画像
Tripo
Meshy
Tripoのオープンソースのサンプルリリース。
ローカル環境や自社サーバーで実行できるため、独自のアプリケーションやサービスと統合しやすい。
生成されたモデルのクオリティはTripoに比べて精度がかなり低い。
ローカルマシン上で追加のトレーニングが可能で特定の画像に特化したモデルにカスタマイズすることが可能。
比較分析
使いやすさ
使いやすさに関しては、TripoとMeshyが分かりやすいインターフェースと簡単なワークフローで優秀です。それぞれのウェブサイトでサインアップを行いWeb上で使用できる仕組みになっています。TripoSRとInstantMeshはローカル環境のpythonで実行する形になっているので少し手間がかかります。
出力クオリティ
最終的な3Dモデルのクオリティに関してはTripoが最も高く、他の選択肢と比べて参照画像のプロポーションを維持しながら、高解像度のモデルを出力することができます。
次点でMeshyが続きます。参照画像の「穴」の部分を認識し、正確に再現することができますが、プロポーションが参照画像と比べて変更されたり、元々存在しない部分が追加されることが多々ありました。
InstantMeshは、クオリティは悪くありませんが、まだ改善の余地があります。また、生成に時間がかかる傾向があります。
TripoSRは、他の3つと比べてクオリティが一番低い結果となりました。参照画像の認識が不十分で、生成されたモデルの形が大きく歪んだりする場合が多くありました。
参考画像
Tripo
InstantMesh
Meshy
TripoSR
値段
TripoSRとInstantMeshはどちらも無料のオープンソースです。高クオリティなモデルや高速な処理を必要としないプロジェクトで使用することができます。
TripoとMeshyはリクエストベースのビジネスモデルになっており、各生成や改良リクエストには一定量のクレジットが必要です。大量のモデルを生成しようとする場合、非常に高額になる可能性があります。
柔軟性
TripoとMeshyは、APIがすぐに利用可能なサービスとなっており、様々なプラットフォームにサービスを簡単に統合することが可能です。ただしカスタマイズ性に欠けており、提供されるものは利用可能な機能に限られています。
TripoSRやInstantMeshのようなオープンソースのAIモデルは、TripoやMeshyと比べて、自身で改善やカスタマイズを行うことができるので、幅広い用途で利用可能です。
まとめ
クオリティが最優先される場合はTripoやMeshyが最適でした。
十分なドキュメントが用意されており、既存のパイプラインに統合するためのAPIも準備されているので柔軟性が高く、使いやすいです。リクエストベースのビジネスモデルになっており大量のモデルを生成する場合はコストが高くなる可能性があるのでクオリティの高いモデルを数回生成するようなシーンで役立ちそうです。
TripoSRやInstantMeshは、アプリケーション内やローカルサーバー内で手軽に実行できるので、デモ運用やPoC開発時に利用できそうです。カスタムトレーニング済みモデルを実行できるので、特定の対象に特化したモデルを作成できれば利用用途の幅が広がると思っています。
上記ブログの内容に少しでも興味がありましたら、お気軽にご連絡ください。
弊社のエンジニアがフレンドリーに対応させていただきます。