1 Apache离线安装
1.1 软件下载
1.1.1 httpd文件
从http://httpd.apache.org/download.cgi下载httpd文件
1.1.2 apr文件
可到官网http://apr.apache.org/下载apr。
1.1.3 apr-util文件
从官网http://apr.apache.org/下载apr-util。
1.1.4 pcre文件
从官网http://www.pcre.org/下载PCRE。
1.1.5 expat文件
由于系统缺失expat库,需要另外下载expat源码包并安装,否则安装apr-util环境会出错。
下载地址:
https://sourceforge.net/projects/expat/files/expat/2.2.9/
1.2 安装
下载完成后,分别解压这些安装包。
tar -zxvf apr-1.7.0.tar.gz
tar -zxvf apr-util-1.6.1.tar.gz
tar -zxvf pcre-8.43.tar.gz
tar -zxvf httpd-2.4.39.tar.gz
tar -zxvf expat-2.2.9.tar.gz
解压完成后,会出现解压的目录。
然后分别进入四个目录,执行以下命令
cd expat-2.2.9
./configure
make
make install
cd ../apr-1.7.0
./configure --prefix=/usr/local/apr (指定安装目录)
make
make install
cd ../apr-util-1.6.1
./configure --prefix=/usr/local/apr-util --with-apr=/usr/local/apr
make
make install
cd ../pcre
./configure --prefix=/usr/local/pcre
make
make install
cd …/httpd-2.4.39
./configure --prefix=/usr/local/httpd --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr-util --with-pcre=/usr/local/pcre
make
make install
默认安装httpd后在/usr/local/httpd/modules下没有cgi模块,可以通过apxs命令进行离线编译安装cgi。
cd /usr/local/httpd/bin
./apxs -i -a -c /home/jcsa/httpd/modules/mod_cgi.c
将Apache加入系统服务中(待验证):
cp /usr/local/httpd/bin/apachectl /etc/rc.d/init.d/apache
1.3 文件配置
一切都按照流程安装完成后,进入目录 /usr/local/httpd/conf/
打开httpd.conf文件:
`vim httpd.conf`
找到文件中的 #ServerName www.example.com:80
修改为:ServerName 192.168.190.156:80(自己的IP)
在本地浏览器访问apache服务,显示以下内容,表示Apache服务正常。
确保httpd.conf文件中mod_cgi模块加载进来。
2 brat安装
brat是一个文本标注工具,可以标注实体,事件、关系、属性等,只支持在linux下安装,其使用需要webserver,官方给出的教程使用的是Apache2。
2.1 下载brat软件
建议下载brat的release版本地址:
https://github.com/nlplab/brat/releases/tag/v1.3p1
httpd安装成功后,将下载的brat软件解压到/usr/local/httpd/htdocs/brat
使用如下命令对brat目录授权:
sudo chmod 777 -R /usr/local/httpd/htdocs/brat
进入brat目录
cd /usr/local/httpd/htdocs/brat
执行以下命令,根据提示输入用户名、密码、管理员邮箱
sudo ./install.sh
2.2 配置
打开httpd.conf文件:vim httpd.conf或者gedit httpd.conf
增加
<Directory /usr/local/httpd/htdocs/brat>
AllowOverride Options Indexes FileInfo Limit
Require all granted
AddType application/xhtml+xml .xhtml
AddType font/ttf .ttf
Options +ExecCGI
AddHandler cgi-script .cgi
重启httpd后
cd /usr/local/httpd/bin
sudo ./apachectl restart
访问以下网址http://127.0.0.1/brat/
3 brat使用
brat默认不支持中文标注,需要手动修改brat主目录/server/src路径下的projectconfig.py文件的第162行代码,注释源代码,然后另起一行加入新代码(修改之后记得重启apache2服务):
# n = re.sub(r'[^a-zA-Z0-9_-]', '_', n)
n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)
如果使用brat加载本地文件的时候报错“unable to read text file xxx/xxx/xxx/xxx.txt ”,请确保你的txt文件已经授权给当前linux系统的登录用户,授权方式可以参考如下方式:
sudo chmod 777 xxx.txt
请确保python2环境存在,并且python软连接指向的是python2,否则brat可能运行报错(最新的release版本只支持python2),如果需要安装python3可以建立新的软连接,名字叫python3即可;当然这只是参考处理方案,也可以采用虚拟环境的方式在python2下运行brat。
最后,如何添加多个用户:
找到config.py 对应的行,增加:
USER_PASSWORD = {
'admn': 'admin',
'test': 'test',
# (add USERNAME:PASSWORD pairs below this line.)
}
准备数据。把数据放进文件夹中,比如我把数据(即filename.txt文件,filename为文件名)放在data/project/中。每一个句子独立成一个.txt文件。然后按下列操作就可以给data文件夹中每一个.txt文件都产生一个.ann文件。
find data -name '*.txt' | sed -e 's|\.txt|.ann|g' | xargs touch
另外再对新添加的文件夹添加读写权限:
chmod –R 777 ./
4 参考
中标麒麟操作系统6.7版本下安装Apache-2.4.39
Ubuntu 12.94 离线安装(部署)Apache(Apache-2.4.7)
用深度学习做命名实体识别(二):文本标注工具brat
文本标注工具brat部署笔记
所有的离线安装包地址:https://download.csdn.net/download/maoersong/12191533