サイトを読んで、改善タスクに変えるAI SEOクローラー
技術SEO・内部リンク・画像・本文・SERPを横断して、直すURL、足す情報、つなぐページを根拠付きで抽出。 結果はCSV / スプレッドシート / 図表 / 日本語レポートとして出力できます。
サイト全体を読んで、改善タスクに変える
LINKTH CRAWL は、単にクロール結果を並べるだけではありません。テクニカルSEO、画像情報、内部リンク、本文の意味まで横断し、次に直す・足す・つなぐ場所をAIと一緒に絞り込みます。
サイト全体をクロールして、SEO・構造・コンテンツの課題を見つける
163種のSEO検出、内部リンク、クリック深度、画像alt/caption不足、重複・孤立ページなどをURL単位で把握。
大量ページを横断して、改善リスト・集計表・可視化まで作る
100ページでも1000ページでも、どのページに何を直す・足す・つなぐべきかを、CSV / スプレッドシート / 図表で出力。
クロール済みデータにAIで質問し、根拠付きで改善判断を取り出す
サイト本文・画像情報・内部リンク構造をもとに、出典付きで回答。社内データや一次情報を、どのページに活用できるかも探せます。
たとえば、こんな指示ができます
AIに丸投げしない。サイトを読んで、根拠を持って判断する
LINKTH CRAWL は、ページを外部AIにそのまま渡して要約させるだけのツールではありません。クロールした本文・画像・内部リンク・技術情報を独自解析基盤に蓄積し、SEO課題や構造上の問題を根拠付きで整理。最後に、必要な結果だけを生成AIでレポート・表・回答・改善案に変換します。
サイトをクロールする
URLを起点にページ・リンク・画像・技術課題を収集し、CSVやスプレッドシートへ落とせる監査データに変換。
- ページ構造・内部リンク・画像情報を取得
- canonical / noindex / 404 などをURL単位で検出
- 全項目をCSV・スプレッドシート・図表へ出力
サイト構造をRAGにする
本文・画像・内部リンク構造をナレッジ化。質問すると、該当ページと引用文を添えて回答します。
- 本文・画像・リンク文脈を検索できる形に変換
- 「どこに追記できるか」「根拠はどこか」を質問
- 回答にはURLと引用文を付ける
ページUIデザイン・意味をデータ化する
HTMLだけでは分からないファーストビュー、CTA、バナー、余白、視線誘導まで読み取り、画面の見え方と意図を質問できる材料にします。
- ページスクリーンショットからUI要素と配置を抽出
- 見出し・CTA・画像・フォームの役割や意味をデータ化
- 上位プラン向けにUI/UX改善やCV導線の仮説出しに利用
データからAIが出力する
クロール済みデータ、RAG、画像理解、SERP比較をもとに、改善リスト・レポート・図表・質問回答へ変換します。
- URLごとの改善タスクをCSV・スプレッドシート化
- 内部リンク候補・追記候補・技術課題を優先度順に整理
- 日本語レポート・比較表・ヒストグラム・出典付き回答を生成
SERPから競合サイトを分析する
検索結果やAI Overviewの引用元から各サイトへ到達し、構成・不足トピック・自社との差分を比較。
- 検索結果・AIO・関連質問を起点に調査
- 上位サイトの構造・見出し・画像・内部リンクを比較
- 自社に足りない情報や改善候補を抽出
2026 年、SEO 監査も AI が動かす時代へ
既存ツールの 3 つの課題に、AI 対話型クラウドクローラーが答えます。
デスクトップ型クローラーの重い CSV 整形
ローカル PC を半日占有してクロール → CSV を Excel で並び替え → コンサル提案資料に手で清書。毎月この作業に半日〜1 日。
海外 SEO スイートを 4 タブ横断する分析
高額 (¥30K/月〜) なのにダッシュボードが英語、複数タブを行き来する。日本人クライアントへの説明には別資料化が必要。
監査結果から「次にやること」が出ない
issue 一覧は出ても、PageRank ベースの優先順位や主題ズレページの抽出は手作業。コンサルの本質的価値が出しにくい。
7 つの実演シーンで見る、対話型 SEO 監査
MCP 接続後は、Claude / Cursor から自然言語で指示するだけ。出力は HTML / Markdown / グラフ / 表で受け取れます。
クロール開始
自然言語で「礼儀正しく」「全力で」が伝わる。AdaptiveRateLimiter が 429/5xx を見て自動調整。
MCP 経由で AI が「データ層」と「可視化・分析エージェント」を分業することで、コンサル業務の自動化が可能になります。
クロールしたサイトが、そのまま出典付きで答えるナレッジに
「返品は何日以内?」と聞くだけ。回答には必ず出典(該当ページ+実際の文言)が付き、引用が本当にそのページにあるかを検証してから返します。
「商品到着後 8 日以内、未開封・未使用に限り返品可能」
根拠が見つからない質問には、推測せず「該当情報なし」と正直に返します。
必ず出典付き
回答の根拠ページと実際の文言をそのまま提示。コンサル・CS・社内 FAQ にそのまま使えます。
引用を検証してから返す
引用文がそのページに実在するかをチェック。生成 AI 特有のハルシネーションを構造的に防ぎます。
画像も読む
alt / ファイル名に加え、画像内テキストを OCR。図やバナーの中の情報も回答の根拠にできます。
MCP からも REST からも
Claude Code / Cursor からも、自社アプリの REST /chat からも、同じ出典付き RAG を呼べます。
例 / 「このサイトの返品ポリシーは? 出典も付けて」LINKTH CRAWL って何ができるの?
7 つの軸でカバー。各カードの「例: 〜と指示すると」が、そのまま日本語で投げられます。
SEO 監査
163 種検出 (主要クローラー水準の網羅性) + LLM 時代 SEO 検出
- ▸163 種の SEO 問題を重要度順に検出
- ▸LLM 時代 SEO: llms.txt / GPTBot 別宣言 / CSR-only ページ検出
- ▸JS Rendering 対応 (SPA / 遅延ロード / ログイン後ページ)
- ▸Screenshot で証跡を残す
“自社サイトの全 SEO 問題を重要度順に出して”構造分析
PageRank / オーファン / クリック深度 / リンクグラフ
- ▸PageRank (scipy sparse 内部計算)
- ▸オーファンページ / 高価値オーファン検出
- ▸クリック深度 / リダイレクトチェーン解析
- ▸内部リンクグラフ可視化
“クリック深度 4 以上で PageRank 上位ページを CSV で”意味分析・AI 提案
カニバリ検出 / 内部リンク提案 / RAG 挿入位置 / 施策LLM
- ▸pgvector でカニバリ検出 (重複コンテンツペア)
- ▸サイト全体から関連性のあるページ間で内部リンク挿入位置を提案
- ▸外部 PDF / 書籍を RAG 化してメディアに追加可能な位置を提案
- ▸施策提案 LLM (ペルソナ × 行動 × 品質スコア統合)
“コラム記事と商品ページの関連ペアを 50 件、リンク文言含めて出して”可視化レポート
自然言語 → HTML 図表 (ヒストグラム / 円グラフ / Sankey)
- ▸内部リンクヒストグラム / クリック深度円グラフ
- ▸デバイス別 CVR ヒートマップ
- ▸月次差分監査 (変更ページ / 消失 H1 / Title 改変)
- ▸スクリーンショット重畳レポート
“クリック深度の分布を円グラフにして HTML レポートに”データ出力
CSV / Markdown コーパス / Webhook / ClickHouse 同期
- ▸CSV / TSV / xlsx / JSON (主要クローラー互換)
- ▸Markdown コーパス (Firecrawl 互換、LLM 学習用)
- ▸Webhook (crawl.started / page / completed / failed、HMAC 署名)
- ▸ClickHouse 同期 (LINKTH MAP 連携)
“全ページを Markdown 化して GPT 用にコーパス出力”サイトに質問 → 出典付きで回答(ネイティブ RAG)
クロールしたサイトがそのまま「質問できるナレッジ」に。回答には必ず出典(ページ+実際の文言)が付く
- ▸「返品は何日以内?」→ 該当ページを出典付きで回答
- ▸引用文が本当にそのページにあるか検証してから返す(hallucination 防止)
- ▸根拠が無ければ「該当情報なし」と正直に返す(嘘をつかない)
- ▸画像も読む(alt / ファイル名 / 画像内テキスト OCR)
- ▸MCP(Claude Code / Cursor)からも REST /chat からも同じ RAG が使える
“このサイトの返品ポリシーは? 出典も付けて”SERP 分析
検索結果を即取得。クロールなしで競合調査・AI Overview 監視・画像戦略が完結
- ▸オーガニック順位 TOP10〜100件を 1 クエリで取得
- ▸AI Overview (AIO) の有無・概要・引用ドメインをリアルタイム確認
- ▸PAA (People Also Ask) + 関連検索ワードを一括取得
- ▸画像検索 SERP: 上位表示画像の URL・ドメインを返す
- ▸ニュース検索: 記事タイトル・媒体名・公開日時を取得
“"ニキビ 治し方" の検索結果 TOP10 と AI Overview 引用ドメインを出して”これらすべてが Claude Desktop / Claude Code / OpenAI / Cursor から自然言語で実行可能。
CSV / HTML / Markdown / Webhook で結果を受け取れます。
検索結果を、AI が直接読む
クロールせずに競合調査。SERP データを取得し、Claude / Codex が分析・提案まで完結。
オーガニック順位
クエリを渡すと検索上位ページの順位・タイトル・URL・スニペットを返す。競合の順位確認・月次トラッキングに使える
AI Overview 監視
AIO の有無・概要テキスト・引用ドメインをリアルタイム取得。「自社が引用されているか」「どの競合が引用されているか」を即確認
PAA + 関連検索
People Also Ask と関連検索ワードを一括取得。コンテンツ設計・FAQ 作成・FAQ 構造化データ追加の起点に
画像検索 SERP
画像検索の上位表示画像を URL・元ページ・ドメインごとに返す。「どんな画像が上位に来るか」を把握して画像 SEO 戦略を立案
ニュース検索
ニュース検索の上位記事タイトル・媒体名・公開日時を返す。プレスリリース効果の確認・競合の PR 状況把握に
// Claude Code / MCP から自然言語で呼び出せる例
「"ニキビ 治し方" のオーガニック TOP10 と AI Overview の引用ドメインを出して」
→ linkscrawl_serp_full(query="ニキビ 治し方", lang="ja", region="JP")
「競合サイトが上位を取っているクエリの画像 SERP を調べて」
→ linkscrawl_serp_images(query="...", depth=10)
「このキーワードでニュース記事が出ているか確認して」
→ linkscrawl_serp_news(query="...")公式 Python / TypeScript SDK
自然言語チャットではなく、自社 SaaS / バッチ / CI に組み込みたい開発者向け。
Firecrawl / Stripe の SDK と同じ感覚で叩けます。
PyPI / npm への公開は近日予定です。先行利用は LINKTH までお問い合わせください。
pip install ugokicrawl # 近日公開 (PyPI 準備中)from ugokicrawl import UgokiCrawl
client = UgokiCrawl(api_key="uc_xxx")
# クロール → SEO 監査 → CSV 出力を 3 行で
job = client.crawl("https://example.com", max_pages=100)
issues = client.issues(job.job_id, severity="high")
client.export(job.job_id, format="csv", targets=["pages", "issues"])3 行で crawl → audit → export
- ▸sync + async 両対応 (httpx)
- ▸Pydantic v2 で型安全
- ▸429 / 5xx 自動リトライ (Retry-After 尊重)
- ▸cookbook 5 本付属 (crawl / audit / export / webhook / extract)
$ pip install ugokicrawl # 近日公開 (PyPI 準備中)REST API も同じ機能
MCP の 42 機能を REST 経由でそのまま叩けます。Webhook (HMAC-SHA256) で外部システム連携、Retry-After 自動尊重、`X-API-Key` ヘッダ 1 つで認証完了。
SaaS への組み込みが 5 行
社内 SaaS / ダッシュボード / 自動レポート生成バッチに、LINKTH CRAWL を埋め込めます。CSV / Markdown / JSON / XLSX をエクスポートしてそのまま自社プロダクトに流せます。
Stripe / Firecrawl 互換の使い心地
API キー認証、リトライ、レート制限、Webhook 署名検証 — Stripe / Firecrawl SDK に慣れた開発者ならそのまま使えます。
REST API ドキュメント: 近日公開 · Webhook 署名検証は HMAC-SHA256 (Stripe 互換形式)
既存ツールとの比較
検出数の比較だけでなく、クロール後に「何を直すか」まで出せるかで比較してください。
| 機能 | 従来型クローラー | 海外 SEO スイート | LINKTH CRAWL |
|---|---|---|---|
| 実行環境 | ローカル PC | クラウド | クラウド |
| AI / MCP / REST 連携 | 限定的 | 限定的 | ◎ 対話・API・MCP |
| 技術SEO監査 | ◎ 大量検出 | ◎ 大量検出 | ◎ 163項目 + 優先度整理 |
| 内部リンク改善 | リンク一覧中心 | 指標中心 | ◎ 候補ペア・アンカー・送客元まで提案 |
| 出典付きサイト質問 | × | × | ◎ URL・引用付きで回答 |
| ページUI / 画像の理解 | × | 限定的 | ◎ 画面構造・alt/caption・CV導線 |
| SERP / 競合比較 | 別ツール | ◎ 指標中心 | ◎ SERP起点で構造・不足トピック比較 |
| CSV / スプレッドシート出力 | ◎ 手作業整形 | ◎ エクスポート | ◎ 改善リスト・図表まで生成 |
| 日本語コンサル納品 | 手作業 | 英語ダッシュボード中心 | ◎ レポート・表・改善提案 |
| 料金 | 年額数万円〜 | 月額数万円〜 | 無料から利用可能 |
163 種の SEO 検出項目
主要クローラー水準の網羅性 + LLM 主題判定・PageRank 等の独自検出。
インデックス可能性(クリックで全 14 項目)
14 種canonical 矛盾 / noindex+sitemap 衝突 / soft 404
リダイレクト(クリックで全 6 項目)
6 種loop / chain >4 / meta refresh / JS redirect
CWV / Perf(クリックで全 7 項目)
7 種TTFB / FCP / gzip 欠落 / Cache-Control 不在
構造化データ(クリックで全 11 項目)
11 種FAQ 誤用 / Product 必須欠落 / Review 単独宣言
URL 形式(クリックで全 9 項目)
9 種>100 文字 / セッション ID / 二重スラッシュ / 非 ASCII
モバイル対応(クリックで全 5 項目)
5 種viewport 不在 / font <12px / mobile-only redirect
HTML 基本(クリックで全 9 項目)
5 種multiple H1 / html lang / charset / doctype
リンク詳細(クリックで全 13 項目)
7 種空アンカー / 汎用アンカー / 内部リンク数過多
画像(クリックで全 11 項目)
11 種alt 欠落 / srcset 不在 / WebP 未使用 / dimension mismatch
Hreflang (多言語)(クリックで全 7 項目)
7 種言語コード不正 / self-reference 欠落 / x-default なし
Sitemap(クリックで全 6 項目)
6 種50K URL 超 / sitemap 内 4xx / sitemap 内 noindex
コンテンツ(クリックで全 10 項目)
5 種text/HTML 比 / 言語混在 / AI 生成定型句
料金プラン
料金プラン・LLM 従量課金の詳細は現在準備中です。公開準備が整い次第ご案内します。 先行案内をご希望の方は、ページ下部のお問い合わせよりご連絡ください。
Free
まず触って試したい個人 / 学習用途
- 月 1 サイトまで
- 月合計 50,000 ページまで
- 基本 163 検出項目すべて
- CSV / TSV / xlsx / JSON エクスポート
- RAG チャット(出典付き)
- MCP 接続 (AI 対話)
- コミュニティサポート
Starter
個人 SEO 担当 / フリーランス
- 月 3 サイトまで
- 月合計 150,000 ページまで
- 基本 163 検出項目すべて
- MD + HTML 月次納品レポート
- LLM 機能 月 3 回まで含む
- Email サポート
Pro
コンサル / SEO エージェンシー
- 月 10 サイトまで
- 月合計 500,000 ページまで
- カスタムレポートテンプレ
- PageRank + LINKTH MAP 連携
- LLM 機能 月 10 回まで含む
- Slack サポート + 月次定例
Free / Starter / Pro の 3 プラン構成で準備中です。 詳細が決まり次第、当ページにて公開します。