TIKA Server筆記

TIKA

Tika下載

  1. server.jar
http://tika.apache.org/download.html

下載server版,需要java運行環境。注:JAVA9默認缺少server運行所需要的xml.bind包,需要另行解決,JAVA8無問題。

  1. docker
docker pull logicalspark/docker-tikaserver # only on initial download/update
docker run --rm -p 9998:9998 logicalspark/docker-tikaserver
  1. app.jar
app也有server模式,但他並非HTPP協議,所以無法使用curl調試。
  1. maven

Docker Server

  1. 測試服務器
curl -X GET http://localhost:9998/tika
  1. 獲取meta
curl -T test.pdf http://localhost:9998/meta --header "Accept: application/json"
  1. 獲取文檔內容
curl -T test.pdf http://localhost:9998/tika --header "Accept: text/html" # 返回html,帶標籤,可不帶header

文檔

https://wiki.apache.org/tika/TikaJAXRS
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章