php對pdf內容的解析目前有一個很好用的開源項目
傳送門:http://www.pdfparser.org/
php對word中內容的解析則可以調用com組件實現(僅適用windows平臺,且在裝有word的情況下。。。)
代碼如下:
<?php
// 建立一個指向新COM組件的索引
$word = new COM("word.application") or die("Can't start Word!");
$filename = 'E:/wamp/www/pdfword2txt/test.doc';
$word->Documents->OPen($filename);
//讀取文檔內容
$test= $word->ActiveDocument->content->Text;
echo $test;
flush();
$word->Quit();
?>
如果大家還發現更好的解析方法的話,歡迎交流學習~~
轉載請註明出處:http://blog.csdn.net/iluckyning/article/details/22591853