ubuntu下文本标注工具BRAT全程离线安装

1 Apache离线安装

1.1 软件下载

1.1.1 httpd文件

http://httpd.apache.org/download.cgi下载httpd文件
在这里插入图片描述

1.1.2 apr文件

可到官网http://apr.apache.org/下载apr。
在这里插入图片描述

1.1.3 apr-util文件

从官网http://apr.apache.org/下载apr-util。
在这里插入图片描述

1.1.4 pcre文件

从官网http://www.pcre.org/下载PCRE。

1.1.5 expat文件

由于系统缺失expat库,需要另外下载expat源码包并安装,否则安装apr-util环境会出错。
下载地址:
https://sourceforge.net/projects/expat/files/expat/2.2.9/

1.2 安装

下载完成后,分别解压这些安装包。

tar -zxvf apr-1.7.0.tar.gz
tar -zxvf apr-util-1.6.1.tar.gz
tar -zxvf pcre-8.43.tar.gz 
tar -zxvf httpd-2.4.39.tar.gz
tar -zxvf expat-2.2.9.tar.gz

解压完成后,会出现解压的目录。
然后分别进入四个目录,执行以下命令

cd expat-2.2.9
./configure
make
make install

cd ../apr-1.7.0
./configure --prefix=/usr/local/apr (指定安装目录)
make
make install

cd ../apr-util-1.6.1
./configure --prefix=/usr/local/apr-util --with-apr=/usr/local/apr
make
make install

cd ../pcre
./configure --prefix=/usr/local/pcre
make
make install

cd …/httpd-2.4.39
./configure --prefix=/usr/local/httpd --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr-util --with-pcre=/usr/local/pcre
make
make install

默认安装httpd后在/usr/local/httpd/modules下没有cgi模块,可以通过apxs命令进行离线编译安装cgi。

cd /usr/local/httpd/bin
./apxs -i -a -c /home/jcsa/httpd/modules/mod_cgi.c

在这里插入图片描述

将Apache加入系统服务中(待验证):

cp /usr/local/httpd/bin/apachectl /etc/rc.d/init.d/apache

1.3 文件配置

一切都按照流程安装完成后,进入目录 /usr/local/httpd/conf/
打开httpd.conf文件:

`vim httpd.conf`

找到文件中的 #ServerName www.example.com:80
修改为:ServerName 192.168.190.156:80(自己的IP)
在本地浏览器访问apache服务,显示以下内容,表示Apache服务正常。
在这里插入图片描述
确保httpd.conf文件中mod_cgi模块加载进来。
在这里插入图片描述

2 brat安装

brat是一个文本标注工具,可以标注实体,事件、关系、属性等,只支持在linux下安装,其使用需要webserver,官方给出的教程使用的是Apache2。

2.1 下载brat软件

建议下载brat的release版本地址:
https://github.com/nlplab/brat/releases/tag/v1.3p1
httpd安装成功后,将下载的brat软件解压到/usr/local/httpd/htdocs/brat
使用如下命令对brat目录授权:

sudo chmod 777 -R /usr/local/httpd/htdocs/brat

进入brat目录

cd /usr/local/httpd/htdocs/brat 

执行以下命令,根据提示输入用户名、密码、管理员邮箱

sudo ./install.sh

2.2 配置
打开httpd.conf文件:vim httpd.conf或者gedit httpd.conf
增加
<Directory /usr/local/httpd/htdocs/brat>
AllowOverride Options Indexes FileInfo Limit
Require all granted
AddType application/xhtml+xml .xhtml
AddType font/ttf .ttf
Options +ExecCGI
AddHandler cgi-script .cgi

重启httpd后

cd /usr/local/httpd/bin
sudo ./apachectl restart

访问以下网址http://127.0.0.1/brat/
在这里插入图片描述

3 brat使用

brat默认不支持中文标注,需要手动修改brat主目录/server/src路径下的projectconfig.py文件的第162行代码,注释源代码,然后另起一行加入新代码(修改之后记得重启apache2服务):

# n  = re.sub(r'[^a-zA-Z0-9_-]', '_', n)
n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)

如果使用brat加载本地文件的时候报错“unable to read text file xxx/xxx/xxx/xxx.txt ”,请确保你的txt文件已经授权给当前linux系统的登录用户,授权方式可以参考如下方式:

sudo chmod 777 xxx.txt

请确保python2环境存在,并且python软连接指向的是python2,否则brat可能运行报错(最新的release版本只支持python2),如果需要安装python3可以建立新的软连接,名字叫python3即可;当然这只是参考处理方案,也可以采用虚拟环境的方式在python2下运行brat。
最后,如何添加多个用户:
找到config.py 对应的行,增加:

USER_PASSWORD = {
'admn': 'admin',
'test': 'test',
# (add USERNAME:PASSWORD pairs below this line.)
}

准备数据。把数据放进文件夹中,比如我把数据(即filename.txt文件,filename为文件名)放在data/project/中。每一个句子独立成一个.txt文件。然后按下列操作就可以给data文件夹中每一个.txt文件都产生一个.ann文件。

find data -name '*.txt' | sed -e 's|\.txt|.ann|g' | xargs touch

另外再对新添加的文件夹添加读写权限:

chmod –R 777 ./

4 参考

中标麒麟操作系统6.7版本下安装Apache-2.4.39
Ubuntu 12.94 离线安装(部署)Apache(Apache-2.4.7)
用深度学习做命名实体识别(二):文本标注工具brat
文本标注工具brat部署笔记

所有的离线安装包地址:https://download.csdn.net/download/maoersong/12191533

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章