記事エクストラクター

Webページから記事の全文テキストとメタデータを抽出

Home/Communication/記事エクストラクター

What is it?

Webページから記事全文とメタデータを抽出するClaude Codeスキルで、ナビゲーション、広告、サイドバーなどの非コンテンツ要素を除去して、クリーンで読みやすい記事テキストを提供します。

How to use it?

URLを提供すると、スキルが自動的にWebページを取得し、主要な記事コンテンツを特定し、メタデータとともにクリーンなテキストを抽出します。

Key Features

  • 広告、ナビゲーション、ノイズ除去後のクリーンなテキスト抽出
  • タイトル、著者、日付、説明などのメタデータ抽出
  • 様々なWebサイトレイアウトとCMSプラットフォームの処理
  • コンテンツ処理パイプラインのための他のTapestryスキルとの統合
  • 記事構造とフォーマットの保持
View on GitHub

GitHub Stats

Stars
Forks
Last Update
License
MIT
Version
1.0.0

Categories

Features