データ変換サービス事業者のR&Wは,企業が保有するHTMLデータをデータベース管理システム(DBMS)に登録するサービス「HTML2XML2DBソリューション」を,2007年2月7日に提供開始した。既存のデータを変換する使いきりの「既存HTML資産のXML&DB化サービス」(データ量に応じて個別見積)と,継続して生成するHTMLを定期的にDBに取り込む「HTMLデータ定期取り込みサービス」(月額制,最小案件で月額5万円程度から)で構成する。

 HTML2XML2DBソリューションは,HTML文書をXMLデータベースへと変換し,XMLデータベースをDBMSに登録するまでの仕組みを提供するサービスである。DBMSとしては,XMLデータベースだけでなく,RDBMSへのマッピングと登録も可能である。これにより,それまでHTML形式だったために情報システムから利用できなかったデータを有効活用できるようになる。

 同じテンプレートを用いて生成した異なるHTML同士の,どの部分をデータ項目として定義するかを指定することで,自動的にデータ項目に応じたデータを抽出できるようになる。ここで,R&Wは,HTMLタグで括られたデータを単純に変換するだけでなく,抽出すべきデータを確定するための解析エンジンを持っているという。HTMLをWebブラウザで表示させた際に,どこにどのデータが表示されるかという相対的な位置情報を考慮するという。