 |
高精度・超高速テキスト抽出ソフトウェア
Java・Windows対応のライブラリプログラムも用意しております。
Java版はjarファイルでまとめて提供しております。 |
[ 優位性・特徴・動作環境 ] [ 仕様及び制限事項 ] [ API一覧・テキスト抽出速度評価結果 ] [ 価格表・年間保守費 ] [ 年間保守について ] [ JIS X0213:2004及びWindows-31J対応について ] |
 |
| 1.MS-Word |
| 項目 |
仕様(データ変換研究所) |
| 表 |
表は解除し、セルの内容をテキストとして抽出します |
| 添付ファイル |
変換可能です |
| 文書の保護 |
「文書の保護」を設定したファイルは変換可能です |
| 制限事項�@ |
ワードアート文字は変換できません |
| 制限事項�A |
表の形式は各セルの内容が改行で区切られます |
| 制限事項�B |
パスワード保護ファイルは変換できません |
|
| 2.PowerPoint |
| 項目 |
仕様(データ変換研究所) |
| 抽出概要 |
スライドとノートのテキスト抽出を行います |
| スライド番号 |
テキスト抽出しません |
| タグ出力 |
タグ出力しません |
| 制限事項 |
添付されたWord/Excelファイルは抽出できません |
|
| 3.Excel |
| 項目 |
仕様(データ変換研究所) |
| 抽出概要 |
文字列・数値のみ変換します |
| 添付ファイル |
変換可能です |
| CSV形式出力 |
CSV形式でテキストファイルに出力します |
| ブック保護 |
ブック保護を設定したファイルは変換できません |
| シート保護 |
シート保護を設定したファイルは変換可能です |
| ワークシート |
区切り 改行コードを出力しません |
| 制限事項�@ |
付・計算式などの情報は変換しません |
| 制限事項�A |
パスワード保護ファイルは変換できません |
| 制限事項�B |
指定された頁番号、頁数、日付、時刻、ファイル名、シート名は ヘッダとフッダでは抽出しません |
|
| 4.PDF |
| 項目 |
仕様(データ変換研究所) |
| 抽出概要 |
暗号化されていない文字情報をテキスト変換します。 ※PDF1.3の暗号化ファイルはテキスト変換可能です |
| Camp文字 |
抽出できない場合があります |
| symbol文字 |
文字化けする場合があります |
| 制限事項�@ |
「テキスト選択ツール」でコピーできない文字は抽出できません |
| 制限事項�A |
LZW圧縮されたテキストの抽出はできません |
| 制限事項�B |
埋め込みフォント利用の文字データでPDFファイル作成している場合、 PDF内部では文字コードが1から順に割り付けられている。この場合、テキスト抽出を行うと、
1から順の番号が出力される。文字コードの抽出を抑制することはできません |
|
| 5.HTML |
| 項目 |
仕様(データ変換研究所) |
| 抽出概要 |
タグと属性以外の文字列を抽出します |
|
| 6.XML |
| 項目 |
仕様(データ変換研究所) |
| 抽出概要 |
タグと属性以外の文字列を抽出します |
|
 |
[ 優位性・特徴・動作環境 ] [ 仕様及び制限事項 ] [ API一覧・テキスト抽出速度評価結果 ] [ 価格表・年間保守費 ] [ 年間保守について ] [ JIS X0213:2004及びWindows-31J対応について ] |
| [ ページトップ ] |