vasp 编译

首先参考

文章:http://blog.sciencenet.cn/blog-211012-593362.html

 以及:http://bbs.csdn.net/topics/260015576
            http://blog.sciencenet.cn/blog-548663-796287.html

建议:现在最新版本的intel编译器parallel studio包含mpi库,BLAS、LAPACK以及FFT3D,在Intel的机器上,建议统一使用INTLE自家的算法库,这样可以保证速度不至于出问题。


第一篇文章里提到的,vasp安装的前提条件


1、vasp源码包 

 vasp.5.2.tar.gz     ## vasp 源代码
 vasp.5.lib.tar.gz   ## vasp提供的lapack


2、编译器

比如: Intel fortran 11.1(带MKL库)


3、blas库

Intel 编译器带有,也可以使用GotoBLAS2(http://www.tacc.utexas.edu/tacc-projects/gotoblas2/downloads) 

 gotoblas2库编译:
 #tar -xvzf GotoBLAS2-1.13.tar.gz
 #cd GotoBLAS2
 #make TARGET=NEHALEM  (可以选择make CC=icc FC=ifort BINARY=64 TARGET=NEHALEM)

 成功会有提示:GotoBlas build complete
 于是得到了libgoto2_nehalemp-r1.13.a这个文件,在makefile里面相应的写法是BLAS= (路径)/GotoBLAS2/libgoto2_nehalemp-r1.13.a 


4、lapack库

Intel 编译器带有,也可以使用vasp提供的lapack

5、mpi

可以使用openmpi,也可以使用mpich2(安装请百度,或者查看官方网站)
http://www.open-mpi.org/
http://phase.hpcc.jp/mirrors/mpi/mpich2/


6、FFTW (vasp代码自带有,优化选项是可选的)

Intel 编译器带有,但是需要自己编译,可以使用FFTW 3.2.2 (http://www.fftw.org/)

  FFTW lapack-3.5.0编译
 #tar -xvzf lapack-3.5.0.tgz
 #cd lapack-3.5.0
 #mkdir (安装目录)
 #./configure --prefix=(安装目录)
 #make
 #make install

于是在(安装目录)里面有lib、include等文件夹,其中lib包含的libfftw3.a以及include里面的头文件是需要被调用的,相应的makefile的写法

FFT3D   = fftmpi.o fftmpi_map.o fftw3d.o fft3dlib.o (安装目录)/lib/libfftw3.a

以及

FFLAGS = -I(安装目录)/include/ -FR -lowercase -assume byterecl

-------------------------------------------------------------------------------------------------------------------

下面记录我的编译过程

编译环境:centos 6.0,Intel fortran/c++ compoler 11.1 with mkl,mpich2(build with intel) 


1、编译vasp提供的lapack
#tar -xvzf  vasp.5.lib.tar.gz
#cd  vasp.5.lib
#cp makefile.linux_ifc_P4  makefile

修改makefile里面的FC=ifort
#make

2、编译Intel自带的FFTW

#cd  /opt/intel/Compiler/11.1/075/mkl/interfaces/fftw3xf   这个目录根据实际情况修改
#make libem64t F=intel precision=MKL_DOUBLE   于是产生了libfftw3xf_intel.a

3、编译vasp

#tar -xvzf  vasp.5.2.tar.gz
#cd  vasp.5.2
#cp makefile.linux_ifc_P4  makefile

然后修改makefile里面的内容
-----------------------------------

FC=/opt/mpich2-intel-11/bin/mpif90
##FC是编译器路径,如果需要并行,那么就选择相应mpi的路径,串行FC=ifort就行


BLAS= -L/opt/intel/Compiler/11.1/075/mkl/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lmkl_core  -lguide -lpthread
##使用Intel的blas库,注意前面的-L,每一个参数表示指定目录下有一个相应的.a/.so文件


LAPACK= ../vasp.5.lib/lapack_double.o
##使用vasp自带的lapack,注意要先编译好(../vasp.5.lib/lapack_double.o这个文件存在)

##如果使用Intel的lapack则

LAPAC= -L/opt/intel/Compiler/11.1/075/mkl/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lmkl_core  -lguide -lpthread



CPP    = $(CPP_) -DMPI  -DHOST=\"LinuxIFC\" -DIFC \
     -Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc -DNGZhalf \
     -DMPI_BLOCK=8000
##这个是并行的CPP 参数形式


LIB     = -L../vasp.5.lib -ldmy  \
      ../vasp.5.lib/linpack_double.o $(LAPACK) \
      $(SCA) $(BLAS)
##这个我没动

FFT3D   = fftmpi.o fftmpi_map.o fft3dfurth.o fft3dlib.o /opt/intel/Compiler/11.1/075/mkl/interfaces/fftw3xf/libfftw3xf_intel.a
##并行需要的FFT3D注意后面那个文件是要提前编译好的,如果不使用这个文件,可以将其注销
--------------------------------------------------------------------------------------
对于串行程序,基本上只要修改FC和BLAS的路径就行了。

运行vasp的时候要在环境变量里面添加mkl以及mpi的路径,比如在.bashrc里添加
PATH=/opt/intel/Compiler/11.1/075/bin/intel64:/opt/openmpi-intel11/bin/:$PATH
LD_LIBRARY_PATH=/opt/intel/Compiler/11.1/075/lib/intel64:/opt/intel/Compiler/11.1/075/mkl/lib/intel64:/opt/openmpi-intel11/lib/:$LD_LIBRARY_PATH


总结:随着对编译的了解,会慢慢熟悉这个文件的内容,平时参考的各种人的笔记由于版本和环境等问题,可能无法在自己的环境里正确工作,结合实际情况和参考官方档案在这个时候是可以多做做的。


顺便提一下NEB的编译

首先到官方网站下载:http://theory.cm.utexas.edu/vasp/downloads/
并按照官网的提示修改main.f以及makefile,以及要将源代码文件拷贝到vasp编译目录(注意每次make clean后这些文件就被删除了,要重新拷贝),还有需要注意的是不要弄错版本。


----vasp 运行段错误问题
在FLAG的选项中加入: -heap-arrays  64  试试看



---- 找不到库文件,但是这个库文件能locate到
在/etc/ld.conf 或者 /etc/ld.conf.d/xx.conf里面添加库路径,然后   sudo ldconfig
---- mpirun 需要启动mpd,在用户家目录建立一个.mpd.conf,然后mpd --daemon
---- Intel 编译器 2014 (13.n)的问题,貌似没有带mpi的某些函数,解决办法是安装2013(12.n)或者是安装2015

----相关优化问题,待研究。。。。



#############贴上一个并行版本的vasp编译文件#############

.SUFFIXES: .inc .f .f90 .F


SUFFIX=.f90


CPP_ =  ./preprocess <$*.F | /usr/bin/cpp -P -C -traditional >$*$(SUFFIX)


FFLAGS = -I/share/apps/fftw/include  -FR -assume byterecl -heap-arrays 64


OFLAG=-O3


OFLAG_HIGH = $(OFLAG)
OBJ_HIGH = 
OBJ_NOOPT = 
DEBUG  = -FR -O0
INLINE = $(OFLAG)


LIB  = -L../vasp.5.lib -ldmy \
     ../vasp.5.lib/linpack_double.o $(LAPACK) \
     $(BLAS)


LINK    = 


FC=mpif77


CPP    = $(CPP_) -DMPI  -DHOST=\"LinuxIFC\" -DIFC \
     -Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc -DNGZhalf \
     -DMPI_BLOCK=8000 


MKLPATH=/share/apps/intel/composer_xe_2015.1.133/mkl/lib/intel64



LAPACK=
BLAS= -L$(MKLPATH) -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lpthread
SCA=


LIB     = -L../vasp.5.lib -ldmy  \
      ../vasp.5.lib/linpack_double.o $(LAPACK) \
      $(SCA) $(BLAS)



FFT3D   = fftmpi.o fftmpi_map.o fftw3d.o fft3dlib.o  /share/apps/fftw/lib/libfftw3.a


BASIC=   symmetry.o symlib.o   lattlib.o  random.o   


SOURCE=  base.o     mpi.o      smart_allocate.o      xml.o  \
         constant.o jacobi.o   main_mpi.o  scala.o   \
         asa.o      lattice.o  poscar.o   ini.o       xclib.o     xclib_grad.o \
         radial.o   pseudo.o   mgrid.o    gridq.o     ebs.o  \
         mkpoints.o wave.o     wave_mpi.o  wave_high.o  \
         $(BASIC)   nonl.o     nonlr.o    nonl_high.o dfast.o    choleski2.o \
         mix.o      hamil.o    xcgrad.o   xcspin.o    potex1.o   potex2.o  \
         metagga.o constrmag.o cl_shift.o relativistic.o LDApU.o \
         paw_base.o egrad.o    pawsym.o   pawfock.o  pawlhf.o    paw.o   \
         mkpoints_full.o       charge.o   dipol.o    pot.o  \
         dos.o      elf.o      tet.o      tetweight.o hamil_rot.o \
         steep.o    chain.o    dyna.o     sphpro.o    us.o  core_rel.o \
         aedens.o   wavpre.o   wavpre_noio.o broyden.o \
         dynbr.o    rmm-diis.o reader.o   writer.o   tutor.o xml_writer.o \
         brent.o    stufak.o   fileio.o   opergrid.o stepver.o  \
         chgloc.o   fast_aug.o fock.o     mkpoints_change.o sym_grad.o \
         mymath.o   internals.o dimer_heyden.o dvvtrajectory.o vdwforcefield.o \
         hamil_high.o nmr.o    force.o \
         pead.o     subrot.o   subrot_scf.o pwlhf.o  gw_model.o optreal.o   davidson.o \
         electron.o rot.o  electron_all.o shm.o    pardens.o  paircorrection.o \
         optics.o   constr_cell_relax.o   stm.o    finite_diff.o elpol.o    \
         hamil_lr.o rmm-diis_lr.o  subrot_cluster.o subrot_lr.o \
         lr_helper.o hamil_lrf.o   elinear_response.o ilinear_response.o \
         linear_optics.o linear_response.o   \
         setlocalpp.o  wannier.o electron_OEP.o electron_lhf.o twoelectron4o.o \
         ratpol.o screened_2e.o wave_cacher.o chi_base.o wpot.o local_field.o \
         ump2.o bse.o acfdt.o chi.o sydmat.o 


INC=


vasp: $(SOURCE) $(FFT3D) $(INC) main.o 
rm -f vasp
$(FCL) -o vasp main.o  $(SOURCE)   $(FFT3D) $(LIB) $(LINK)
makeparam: $(SOURCE) $(FFT3D) makeparam.o main.F $(INC)
$(FCL) -o makeparam  $(LINK) makeparam.o $(SOURCE) $(FFT3D) $(LIB)
zgemmtest: zgemmtest.o base.o random.o $(INC)
$(FCL) -o zgemmtest $(LINK) zgemmtest.o random.o base.o $(LIB)
dgemmtest: dgemmtest.o base.o random.o $(INC)
$(FCL) -o dgemmtest $(LINK) dgemmtest.o random.o base.o $(LIB) 
ffttest: base.o smart_allocate.o mpi.o mgrid.o random.o ffttest.o $(FFT3D) $(INC)
$(FCL) -o ffttest $(LINK) ffttest.o mpi.o mgrid.o random.o smart_allocate.o base.o $(FFT3D) $(LIB)
kpoints: $(SOURCE) $(FFT3D) makekpoints.o main.F $(INC)
$(FCL) -o kpoints $(LINK) makekpoints.o $(SOURCE) $(FFT3D) $(LIB)


clean:
-rm -f *.g *.f *.o *.L *.mod ; touch *.F


main.o: main$(SUFFIX)
$(FC) $(FFLAGS)$(DEBUG)  $(INCS) -c main$(SUFFIX)
xcgrad.o: xcgrad$(SUFFIX)
$(FC) $(FFLAGS) $(INLINE)  $(INCS) -c xcgrad$(SUFFIX)
xcspin.o: xcspin$(SUFFIX)
$(FC) $(FFLAGS) $(INLINE)  $(INCS) -c xcspin$(SUFFIX)


makeparam.o: makeparam$(SUFFIX)
$(FC) $(FFLAGS)$(DEBUG)  $(INCS) -c makeparam$(SUFFIX)


makeparam$(SUFFIX): makeparam.F main.F 
base.o: base.inc base.F
mgrid.o: mgrid.inc mgrid.F
constant.o: constant.inc constant.F
lattice.o: lattice.inc lattice.F
setex.o: setexm.inc setex.F
pseudo.o: pseudo.inc pseudo.F
poscar.o: poscar.inc poscar.F
mkpoints.o: mkpoints.inc mkpoints.F
wave.o: wave.inc wave.F
nonl.o: nonl.inc nonl.F
nonlr.o: nonlr.inc nonlr.F


$(OBJ_HIGH):
$(CPP)
$(FC) $(FFLAGS) $(OFLAG_HIGH) $(INCS) -c $*$(SUFFIX)
$(OBJ_NOOPT):
$(CPP)
$(FC) $(FFLAGS) $(INCS) -c $*$(SUFFIX)


fft3dlib_f77.o: fft3dlib_f77.F
$(CPP)
$(F77) $(FFLAGS_F77) -c $*$(SUFFIX)


.F.o:
$(CPP)
$(FC) $(FFLAGS) $(OFLAG) $(INCS) -c $*$(SUFFIX)
.F$(SUFFIX):
$(CPP)
$(SUFFIX).o:
$(FC) $(FFLAGS) $(OFLAG) $(INCS) -c $*$(SUFFIX)




fft3dlib.o : fft3dlib.F
$(CPP)
$(FC) -FR  -O2 -c $*$(SUFFIX)
fft3dfurth.o : fft3dfurth.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


radial.o : radial.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


symlib.o : symlib.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


symmetry.o : symmetry.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


wave_mpi.o : wave_mpi.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


wave.o : wave.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


dynbr.o : dynbr.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


asa.o : asa.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


broyden.o : broyden.F
$(CPP)
$(FC) -FR  -O2 -c $*$(SUFFIX)


us.o : us.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


LDApU.o : LDApU.F
$(CPP)
$(FC) -FR  -O2 -c $*$(SUFFIX)


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章