首先參考
文章:http://blog.sciencenet.cn/blog-211012-593362.html
以及:http://bbs.csdn.net/topics/260015576http://blog.sciencenet.cn/blog-548663-796287.html
建議:現在最新版本的intel編譯器parallel studio包含mpi庫,BLAS、LAPACK以及FFT3D,在Intel的機器上,建議統一使用INTLE自家的算法庫,這樣可以保證速度不至於出問題。
第一篇文章裏提到的,vasp安裝的前提條件
1、vasp源碼包
vasp.5.2.tar.gz ## vasp 源代碼
vasp.5.lib.tar.gz ## vasp提供的lapack
2、編譯器
比如: Intel fortran 11.1(帶MKL庫)
3、blas庫
Intel 編譯器帶有,也可以使用GotoBLAS2(http://www.tacc.utexas.edu/tacc-projects/gotoblas2/downloads)
gotoblas2庫編譯:
#tar -xvzf GotoBLAS2-1.13.tar.gz
#cd GotoBLAS2
#make TARGET=NEHALEM (可以選擇make CC=icc FC=ifort BINARY=64 TARGET=NEHALEM)
成功會有提示:GotoBlas build complete
於是得到了libgoto2_nehalemp-r1.13.a這個文件,在makefile裏面相應的寫法是BLAS= (路徑)/GotoBLAS2/libgoto2_nehalemp-r1.13.a
4、lapack庫
Intel 編譯器帶有,也可以使用vasp提供的lapack
5、mpi
可以使用openmpi,也可以使用mpich2(安裝請百度,或者查看官方網站)
http://www.open-mpi.org/
http://phase.hpcc.jp/mirrors/mpi/mpich2/
6、FFTW (vasp代碼自帶有,優化選項是可選的)
Intel 編譯器帶有,但是需要自己編譯,可以使用FFTW 3.2.2 (http://www.fftw.org/)
FFTW lapack-3.5.0編譯
#tar -xvzf lapack-3.5.0.tgz
#cd lapack-3.5.0
#mkdir (安裝目錄)
#./configure --prefix=(安裝目錄)
#make
#make install
於是在(安裝目錄)裏面有lib、include等文件夾,其中lib包含的libfftw3.a以及include裏面的頭文件是需要被調用的,相應的makefile的寫法
FFT3D = fftmpi.o fftmpi_map.o fftw3d.o fft3dlib.o (安裝目錄)/lib/libfftw3.a
以及
FFLAGS = -I(安裝目錄)/include/ -FR -lowercase -assume byterecl
-------------------------------------------------------------------------------------------------------------------下面記錄我的編譯過程
編譯環境:centos 6.0,Intel fortran/c++ compoler 11.1 with mkl,mpich2(build with intel)
1、編譯vasp提供的lapack
#tar -xvzf vasp.5.lib.tar.gz
#cd vasp.5.lib
#cp makefile.linux_ifc_P4 makefile
修改makefile裏面的FC=ifort
#make
2、編譯Intel自帶的FFTW
#cd /opt/intel/Compiler/11.1/075/mkl/interfaces/fftw3xf 這個目錄根據實際情況修改
#make libem64t F=intel precision=MKL_DOUBLE 於是產生了libfftw3xf_intel.a
3、編譯vasp
#tar -xvzf vasp.5.2.tar.gz
#cd vasp.5.2
#cp makefile.linux_ifc_P4 makefile
然後修改makefile裏面的內容
-----------------------------------
FC=/opt/mpich2-intel-11/bin/mpif90
##FC是編譯器路徑,如果需要並行,那麼就選擇相應mpi的路徑,串行FC=ifort就行
BLAS= -L/opt/intel/Compiler/11.1/075/mkl/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lguide -lpthread
##使用Intel的blas庫,注意前面的-L,每一個參數表示指定目錄下有一個相應的.a/.so文件
LAPACK= ../vasp.5.lib/lapack_double.o
##使用vasp自帶的lapack,注意要先編譯好(../vasp.5.lib/lapack_double.o這個文件存在)
##如果使用Intel的lapack則
LAPAC= -L/opt/intel/Compiler/11.1/075/mkl/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lguide -lpthread
CPP = $(CPP_) -DMPI -DHOST=\"LinuxIFC\" -DIFC \
-Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc -DNGZhalf \
-DMPI_BLOCK=8000
##這個是並行的CPP 參數形式
LIB = -L../vasp.5.lib -ldmy \
../vasp.5.lib/linpack_double.o $(LAPACK) \
$(SCA) $(BLAS)
##這個我沒動
FFT3D = fftmpi.o fftmpi_map.o fft3dfurth.o fft3dlib.o /opt/intel/Compiler/11.1/075/mkl/interfaces/fftw3xf/libfftw3xf_intel.a
##並行需要的FFT3D注意後面那個文件是要提前編譯好的,如果不使用這個文件,可以將其註銷
--------------------------------------------------------------------------------------
對於串行程序,基本上只要修改FC和BLAS的路徑就行了。
運行vasp的時候要在環境變量裏面添加mkl以及mpi的路徑,比如在.bashrc裏添加
PATH=/opt/intel/Compiler/11.1/075/bin/intel64:/opt/openmpi-intel11/bin/:$PATH
LD_LIBRARY_PATH=/opt/intel/Compiler/11.1/075/lib/intel64:/opt/intel/Compiler/11.1/075/mkl/lib/intel64:/opt/openmpi-intel11/lib/:$LD_LIBRARY_PATH
總結:隨着對編譯的瞭解,會慢慢熟悉這個文件的內容,平時參考的各種人的筆記由於版本和環境等問題,可能無法在自己的環境里正確工作,結合實際情況和參考官方檔案在這個時候是可以多做做的。
順便提一下NEB的編譯
首先到官方網站下載:http://theory.cm.utexas.edu/vasp/downloads/
並按照官網的提示修改main.f以及makefile,以及要將源代碼文件拷貝到vasp編譯目錄(注意每次make clean後這些文件就被刪除了,要重新拷貝),還有需要注意的是不要弄錯版本。
----vasp 運行段錯誤問題
在FLAG的選項中加入: -heap-arrays 64 試試看
---- 找不到庫文件,但是這個庫文件能locate到
在/etc/ld.conf 或者 /etc/ld.conf.d/xx.conf裏面添加庫路徑,然後 sudo ldconfig
---- mpirun 需要啓動mpd,在用戶家目錄建立一個.mpd.conf,然後mpd --daemon
---- Intel 編譯器 2014 (13.n)的問題,貌似沒有帶mpi的某些函數,解決辦法是安裝2013(12.n)或者是安裝2015
----相關優化問題,待研究。。。。
#############貼上一個並行版本的vasp編譯文件#############
.SUFFIXES: .inc .f .f90 .F
SUFFIX=.f90
CPP_ = ./preprocess <$*.F | /usr/bin/cpp -P -C -traditional >$*$(SUFFIX)
FFLAGS = -I/share/apps/fftw/include -FR -assume byterecl -heap-arrays 64
OFLAG=-O3
OFLAG_HIGH = $(OFLAG)
OBJ_HIGH =
OBJ_NOOPT =
DEBUG = -FR -O0
INLINE = $(OFLAG)
LIB = -L../vasp.5.lib -ldmy \
../vasp.5.lib/linpack_double.o $(LAPACK) \
$(BLAS)
LINK =
FC=mpif77
CPP = $(CPP_) -DMPI -DHOST=\"LinuxIFC\" -DIFC \
-Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc -DNGZhalf \
-DMPI_BLOCK=8000
MKLPATH=/share/apps/intel/composer_xe_2015.1.133/mkl/lib/intel64
LAPACK=
BLAS= -L$(MKLPATH) -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lpthread
SCA=
LIB = -L../vasp.5.lib -ldmy \
../vasp.5.lib/linpack_double.o $(LAPACK) \
$(SCA) $(BLAS)
FFT3D = fftmpi.o fftmpi_map.o fftw3d.o fft3dlib.o /share/apps/fftw/lib/libfftw3.a
BASIC= symmetry.o symlib.o lattlib.o random.o
SOURCE= base.o mpi.o smart_allocate.o xml.o \
constant.o jacobi.o main_mpi.o scala.o \
asa.o lattice.o poscar.o ini.o xclib.o xclib_grad.o \
radial.o pseudo.o mgrid.o gridq.o ebs.o \
mkpoints.o wave.o wave_mpi.o wave_high.o \
$(BASIC) nonl.o nonlr.o nonl_high.o dfast.o choleski2.o \
mix.o hamil.o xcgrad.o xcspin.o potex1.o potex2.o \
metagga.o constrmag.o cl_shift.o relativistic.o LDApU.o \
paw_base.o egrad.o pawsym.o pawfock.o pawlhf.o paw.o \
mkpoints_full.o charge.o dipol.o pot.o \
dos.o elf.o tet.o tetweight.o hamil_rot.o \
steep.o chain.o dyna.o sphpro.o us.o core_rel.o \
aedens.o wavpre.o wavpre_noio.o broyden.o \
dynbr.o rmm-diis.o reader.o writer.o tutor.o xml_writer.o \
brent.o stufak.o fileio.o opergrid.o stepver.o \
chgloc.o fast_aug.o fock.o mkpoints_change.o sym_grad.o \
mymath.o internals.o dimer_heyden.o dvvtrajectory.o vdwforcefield.o \
hamil_high.o nmr.o force.o \
pead.o subrot.o subrot_scf.o pwlhf.o gw_model.o optreal.o davidson.o \
electron.o rot.o electron_all.o shm.o pardens.o paircorrection.o \
optics.o constr_cell_relax.o stm.o finite_diff.o elpol.o \
hamil_lr.o rmm-diis_lr.o subrot_cluster.o subrot_lr.o \
lr_helper.o hamil_lrf.o elinear_response.o ilinear_response.o \
linear_optics.o linear_response.o \
setlocalpp.o wannier.o electron_OEP.o electron_lhf.o twoelectron4o.o \
ratpol.o screened_2e.o wave_cacher.o chi_base.o wpot.o local_field.o \
ump2.o bse.o acfdt.o chi.o sydmat.o
INC=
vasp: $(SOURCE) $(FFT3D) $(INC) main.o
rm -f vasp
$(FCL) -o vasp main.o $(SOURCE) $(FFT3D) $(LIB) $(LINK)
makeparam: $(SOURCE) $(FFT3D) makeparam.o main.F $(INC)
$(FCL) -o makeparam $(LINK) makeparam.o $(SOURCE) $(FFT3D) $(LIB)
zgemmtest: zgemmtest.o base.o random.o $(INC)
$(FCL) -o zgemmtest $(LINK) zgemmtest.o random.o base.o $(LIB)
dgemmtest: dgemmtest.o base.o random.o $(INC)
$(FCL) -o dgemmtest $(LINK) dgemmtest.o random.o base.o $(LIB)
ffttest: base.o smart_allocate.o mpi.o mgrid.o random.o ffttest.o $(FFT3D) $(INC)
$(FCL) -o ffttest $(LINK) ffttest.o mpi.o mgrid.o random.o smart_allocate.o base.o $(FFT3D) $(LIB)
kpoints: $(SOURCE) $(FFT3D) makekpoints.o main.F $(INC)
$(FCL) -o kpoints $(LINK) makekpoints.o $(SOURCE) $(FFT3D) $(LIB)
clean:
-rm -f *.g *.f *.o *.L *.mod ; touch *.F
main.o: main$(SUFFIX)
$(FC) $(FFLAGS)$(DEBUG) $(INCS) -c main$(SUFFIX)
xcgrad.o: xcgrad$(SUFFIX)
$(FC) $(FFLAGS) $(INLINE) $(INCS) -c xcgrad$(SUFFIX)
xcspin.o: xcspin$(SUFFIX)
$(FC) $(FFLAGS) $(INLINE) $(INCS) -c xcspin$(SUFFIX)
makeparam.o: makeparam$(SUFFIX)
$(FC) $(FFLAGS)$(DEBUG) $(INCS) -c makeparam$(SUFFIX)
makeparam$(SUFFIX): makeparam.F main.F
base.o: base.inc base.F
mgrid.o: mgrid.inc mgrid.F
constant.o: constant.inc constant.F
lattice.o: lattice.inc lattice.F
setex.o: setexm.inc setex.F
pseudo.o: pseudo.inc pseudo.F
poscar.o: poscar.inc poscar.F
mkpoints.o: mkpoints.inc mkpoints.F
wave.o: wave.inc wave.F
nonl.o: nonl.inc nonl.F
nonlr.o: nonlr.inc nonlr.F
$(OBJ_HIGH):
$(CPP)
$(FC) $(FFLAGS) $(OFLAG_HIGH) $(INCS) -c $*$(SUFFIX)
$(OBJ_NOOPT):
$(CPP)
$(FC) $(FFLAGS) $(INCS) -c $*$(SUFFIX)
fft3dlib_f77.o: fft3dlib_f77.F
$(CPP)
$(F77) $(FFLAGS_F77) -c $*$(SUFFIX)
.F.o:
$(CPP)
$(FC) $(FFLAGS) $(OFLAG) $(INCS) -c $*$(SUFFIX)
.F$(SUFFIX):
$(CPP)
$(SUFFIX).o:
$(FC) $(FFLAGS) $(OFLAG) $(INCS) -c $*$(SUFFIX)
fft3dlib.o : fft3dlib.F
$(CPP)
$(FC) -FR -O2 -c $*$(SUFFIX)
fft3dfurth.o : fft3dfurth.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
radial.o : radial.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
symlib.o : symlib.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
symmetry.o : symmetry.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
wave_mpi.o : wave_mpi.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
wave.o : wave.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
dynbr.o : dynbr.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
asa.o : asa.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
broyden.o : broyden.F
$(CPP)
$(FC) -FR -O2 -c $*$(SUFFIX)
us.o : us.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)
LDApU.o : LDApU.F
$(CPP)
$(FC) -FR -O2 -c $*$(SUFFIX)