データ変換研究所
 
 
 
サイト内検索
データ変換研究所 テキスト抽出
デ変研 テキスト抽出 DocCat デ変研 テキスト抽出 DocCatPDFオプション デ変研 テキスト抽出 デ変研MFXライブラリ デ変研 テキスト抽出 デ変研TFライブラリ
デ変研 TFライブラリ
高精度・超高速テキスト抽出ソフトウェア
Java・Windows対応のライブラリプログラムも用意しております。
Java版はjarファイルでまとめて提供しております。
[ 優位性・特徴・動作環境 ] [ 仕様及び制限事項 ] [ API一覧・テキスト抽出速度評価結果 ] 
[ 価格表・年間保守費 ] [ 年間保守について ] [ JIS X0213:2004及びWindows-31J対応について ]
仕様及び制限事項
1.MS-Word
項目 仕様(データ変換研究所)
表は解除し、セルの内容をテキストとして抽出します
添付ファイル 変換可能です
文書の保護 「文書の保護」を設定したファイルは変換可能です
制限事項�@ ワードアート文字は変換できません
制限事項�A 表の形式は各セルの内容が改行で区切られます
制限事項�B パスワード保護ファイルは変換できません
2.PowerPoint
項目 仕様(データ変換研究所)
抽出概要 スライドとノートのテキスト抽出を行います
スライド番号 テキスト抽出しません
タグ出力 タグ出力しません
制限事項 添付されたWord/Excelファイルは抽出できません
3.Excel
項目 仕様(データ変換研究所)
抽出概要 文字列・数値のみ変換します
添付ファイル 変換可能です
CSV形式出力 CSV形式でテキストファイルに出力します
ブック保護 ブック保護を設定したファイルは変換できません
シート保護 シート保護を設定したファイルは変換可能です
ワークシート 区切り 改行コードを出力しません
制限事項�@ 付・計算式などの情報は変換しません
制限事項�A パスワード保護ファイルは変換できません
制限事項�B 指定された頁番号、頁数、日付、時刻、ファイル名、シート名は ヘッダとフッダでは抽出しません
4.PDF
項目 仕様(データ変換研究所)
抽出概要 暗号化されていない文字情報をテキスト変換します。 ※PDF1.3の暗号化ファイルはテキスト変換可能です
Camp文字 抽出できない場合があります
symbol文字 文字化けする場合があります
制限事項�@ 「テキスト選択ツール」でコピーできない文字は抽出できません
制限事項�A LZW圧縮されたテキストの抽出はできません
制限事項�B 埋め込みフォント利用の文字データでPDFファイル作成している場合、 PDF内部では文字コードが1から順に割り付けられている。この場合、テキスト抽出を行うと、 1から順の番号が出力される。文字コードの抽出を抑制することはできません
5.HTML
項目 仕様(データ変換研究所)
抽出概要 タグと属性以外の文字列を抽出します
6.XML
項目 仕様(データ変換研究所)
抽出概要 タグと属性以外の文字列を抽出します
[ 優位性・特徴・動作環境 ] [ 仕様及び制限事項 ] [ API一覧・テキスト抽出速度評価結果 ] 
[ 価格表・年間保守費 ] [ 年間保守について ] [ JIS X0213:2004及びWindows-31J対応について ]
[ ページトップ ]

株式会社 データ変換研究所
〒604-8155 京都市中京区錦小路通室町東入占出山町308 ヤマチュウビル1F
TEL075-254-8780 FAX075-254-8790  050-3540-2795(IP電話番号)

データ変換研究所
『記載されている各社の会社名・製品名は各社の登録商標または商標です』 ©Dehenken Limited 2006-2008. All Rights Reserved.