vasp 編譯

首先參考

文章:http://blog.sciencenet.cn/blog-211012-593362.html

 以及:http://bbs.csdn.net/topics/260015576
            http://blog.sciencenet.cn/blog-548663-796287.html

建議:現在最新版本的intel編譯器parallel studio包含mpi庫,BLAS、LAPACK以及FFT3D,在Intel的機器上,建議統一使用INTLE自家的算法庫,這樣可以保證速度不至於出問題。


第一篇文章裏提到的,vasp安裝的前提條件


1、vasp源碼包 

 vasp.5.2.tar.gz     ## vasp 源代碼
 vasp.5.lib.tar.gz   ## vasp提供的lapack


2、編譯器

比如: Intel fortran 11.1(帶MKL庫)


3、blas庫

Intel 編譯器帶有,也可以使用GotoBLAS2(http://www.tacc.utexas.edu/tacc-projects/gotoblas2/downloads) 

 gotoblas2庫編譯:
 #tar -xvzf GotoBLAS2-1.13.tar.gz
 #cd GotoBLAS2
 #make TARGET=NEHALEM  (可以選擇make CC=icc FC=ifort BINARY=64 TARGET=NEHALEM)

 成功會有提示:GotoBlas build complete
 於是得到了libgoto2_nehalemp-r1.13.a這個文件,在makefile裏面相應的寫法是BLAS= (路徑)/GotoBLAS2/libgoto2_nehalemp-r1.13.a 


4、lapack庫

Intel 編譯器帶有,也可以使用vasp提供的lapack

5、mpi

可以使用openmpi,也可以使用mpich2(安裝請百度,或者查看官方網站)
http://www.open-mpi.org/
http://phase.hpcc.jp/mirrors/mpi/mpich2/


6、FFTW (vasp代碼自帶有,優化選項是可選的)

Intel 編譯器帶有,但是需要自己編譯,可以使用FFTW 3.2.2 (http://www.fftw.org/)

  FFTW lapack-3.5.0編譯
 #tar -xvzf lapack-3.5.0.tgz
 #cd lapack-3.5.0
 #mkdir (安裝目錄)
 #./configure --prefix=(安裝目錄)
 #make
 #make install

於是在(安裝目錄)裏面有lib、include等文件夾,其中lib包含的libfftw3.a以及include裏面的頭文件是需要被調用的,相應的makefile的寫法

FFT3D   = fftmpi.o fftmpi_map.o fftw3d.o fft3dlib.o (安裝目錄)/lib/libfftw3.a

以及

FFLAGS = -I(安裝目錄)/include/ -FR -lowercase -assume byterecl

-------------------------------------------------------------------------------------------------------------------

下面記錄我的編譯過程

編譯環境:centos 6.0,Intel fortran/c++ compoler 11.1 with mkl,mpich2(build with intel) 


1、編譯vasp提供的lapack
#tar -xvzf  vasp.5.lib.tar.gz
#cd  vasp.5.lib
#cp makefile.linux_ifc_P4  makefile

修改makefile裏面的FC=ifort
#make

2、編譯Intel自帶的FFTW

#cd  /opt/intel/Compiler/11.1/075/mkl/interfaces/fftw3xf   這個目錄根據實際情況修改
#make libem64t F=intel precision=MKL_DOUBLE   於是產生了libfftw3xf_intel.a

3、編譯vasp

#tar -xvzf  vasp.5.2.tar.gz
#cd  vasp.5.2
#cp makefile.linux_ifc_P4  makefile

然後修改makefile裏面的內容
-----------------------------------

FC=/opt/mpich2-intel-11/bin/mpif90
##FC是編譯器路徑,如果需要並行,那麼就選擇相應mpi的路徑,串行FC=ifort就行


BLAS= -L/opt/intel/Compiler/11.1/075/mkl/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lmkl_core  -lguide -lpthread
##使用Intel的blas庫,注意前面的-L,每一個參數表示指定目錄下有一個相應的.a/.so文件


LAPACK= ../vasp.5.lib/lapack_double.o
##使用vasp自帶的lapack,注意要先編譯好(../vasp.5.lib/lapack_double.o這個文件存在)

##如果使用Intel的lapack則

LAPAC= -L/opt/intel/Compiler/11.1/075/mkl/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lmkl_core  -lguide -lpthread



CPP    = $(CPP_) -DMPI  -DHOST=\"LinuxIFC\" -DIFC \
     -Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc -DNGZhalf \
     -DMPI_BLOCK=8000
##這個是並行的CPP 參數形式


LIB     = -L../vasp.5.lib -ldmy  \
      ../vasp.5.lib/linpack_double.o $(LAPACK) \
      $(SCA) $(BLAS)
##這個我沒動

FFT3D   = fftmpi.o fftmpi_map.o fft3dfurth.o fft3dlib.o /opt/intel/Compiler/11.1/075/mkl/interfaces/fftw3xf/libfftw3xf_intel.a
##並行需要的FFT3D注意後面那個文件是要提前編譯好的,如果不使用這個文件,可以將其註銷
--------------------------------------------------------------------------------------
對於串行程序,基本上只要修改FC和BLAS的路徑就行了。

運行vasp的時候要在環境變量裏面添加mkl以及mpi的路徑,比如在.bashrc裏添加
PATH=/opt/intel/Compiler/11.1/075/bin/intel64:/opt/openmpi-intel11/bin/:$PATH
LD_LIBRARY_PATH=/opt/intel/Compiler/11.1/075/lib/intel64:/opt/intel/Compiler/11.1/075/mkl/lib/intel64:/opt/openmpi-intel11/lib/:$LD_LIBRARY_PATH


總結:隨着對編譯的瞭解,會慢慢熟悉這個文件的內容,平時參考的各種人的筆記由於版本和環境等問題,可能無法在自己的環境里正確工作,結合實際情況和參考官方檔案在這個時候是可以多做做的。


順便提一下NEB的編譯

首先到官方網站下載:http://theory.cm.utexas.edu/vasp/downloads/
並按照官網的提示修改main.f以及makefile,以及要將源代碼文件拷貝到vasp編譯目錄(注意每次make clean後這些文件就被刪除了,要重新拷貝),還有需要注意的是不要弄錯版本。


----vasp 運行段錯誤問題
在FLAG的選項中加入: -heap-arrays  64  試試看



---- 找不到庫文件,但是這個庫文件能locate到
在/etc/ld.conf 或者 /etc/ld.conf.d/xx.conf裏面添加庫路徑,然後   sudo ldconfig
---- mpirun 需要啓動mpd,在用戶家目錄建立一個.mpd.conf,然後mpd --daemon
---- Intel 編譯器 2014 (13.n)的問題,貌似沒有帶mpi的某些函數,解決辦法是安裝2013(12.n)或者是安裝2015

----相關優化問題,待研究。。。。



#############貼上一個並行版本的vasp編譯文件#############

.SUFFIXES: .inc .f .f90 .F


SUFFIX=.f90


CPP_ =  ./preprocess <$*.F | /usr/bin/cpp -P -C -traditional >$*$(SUFFIX)


FFLAGS = -I/share/apps/fftw/include  -FR -assume byterecl -heap-arrays 64


OFLAG=-O3


OFLAG_HIGH = $(OFLAG)
OBJ_HIGH = 
OBJ_NOOPT = 
DEBUG  = -FR -O0
INLINE = $(OFLAG)


LIB  = -L../vasp.5.lib -ldmy \
     ../vasp.5.lib/linpack_double.o $(LAPACK) \
     $(BLAS)


LINK    = 


FC=mpif77


CPP    = $(CPP_) -DMPI  -DHOST=\"LinuxIFC\" -DIFC \
     -Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc -DNGZhalf \
     -DMPI_BLOCK=8000 


MKLPATH=/share/apps/intel/composer_xe_2015.1.133/mkl/lib/intel64



LAPACK=
BLAS= -L$(MKLPATH) -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lpthread
SCA=


LIB     = -L../vasp.5.lib -ldmy  \
      ../vasp.5.lib/linpack_double.o $(LAPACK) \
      $(SCA) $(BLAS)



FFT3D   = fftmpi.o fftmpi_map.o fftw3d.o fft3dlib.o  /share/apps/fftw/lib/libfftw3.a


BASIC=   symmetry.o symlib.o   lattlib.o  random.o   


SOURCE=  base.o     mpi.o      smart_allocate.o      xml.o  \
         constant.o jacobi.o   main_mpi.o  scala.o   \
         asa.o      lattice.o  poscar.o   ini.o       xclib.o     xclib_grad.o \
         radial.o   pseudo.o   mgrid.o    gridq.o     ebs.o  \
         mkpoints.o wave.o     wave_mpi.o  wave_high.o  \
         $(BASIC)   nonl.o     nonlr.o    nonl_high.o dfast.o    choleski2.o \
         mix.o      hamil.o    xcgrad.o   xcspin.o    potex1.o   potex2.o  \
         metagga.o constrmag.o cl_shift.o relativistic.o LDApU.o \
         paw_base.o egrad.o    pawsym.o   pawfock.o  pawlhf.o    paw.o   \
         mkpoints_full.o       charge.o   dipol.o    pot.o  \
         dos.o      elf.o      tet.o      tetweight.o hamil_rot.o \
         steep.o    chain.o    dyna.o     sphpro.o    us.o  core_rel.o \
         aedens.o   wavpre.o   wavpre_noio.o broyden.o \
         dynbr.o    rmm-diis.o reader.o   writer.o   tutor.o xml_writer.o \
         brent.o    stufak.o   fileio.o   opergrid.o stepver.o  \
         chgloc.o   fast_aug.o fock.o     mkpoints_change.o sym_grad.o \
         mymath.o   internals.o dimer_heyden.o dvvtrajectory.o vdwforcefield.o \
         hamil_high.o nmr.o    force.o \
         pead.o     subrot.o   subrot_scf.o pwlhf.o  gw_model.o optreal.o   davidson.o \
         electron.o rot.o  electron_all.o shm.o    pardens.o  paircorrection.o \
         optics.o   constr_cell_relax.o   stm.o    finite_diff.o elpol.o    \
         hamil_lr.o rmm-diis_lr.o  subrot_cluster.o subrot_lr.o \
         lr_helper.o hamil_lrf.o   elinear_response.o ilinear_response.o \
         linear_optics.o linear_response.o   \
         setlocalpp.o  wannier.o electron_OEP.o electron_lhf.o twoelectron4o.o \
         ratpol.o screened_2e.o wave_cacher.o chi_base.o wpot.o local_field.o \
         ump2.o bse.o acfdt.o chi.o sydmat.o 


INC=


vasp: $(SOURCE) $(FFT3D) $(INC) main.o 
rm -f vasp
$(FCL) -o vasp main.o  $(SOURCE)   $(FFT3D) $(LIB) $(LINK)
makeparam: $(SOURCE) $(FFT3D) makeparam.o main.F $(INC)
$(FCL) -o makeparam  $(LINK) makeparam.o $(SOURCE) $(FFT3D) $(LIB)
zgemmtest: zgemmtest.o base.o random.o $(INC)
$(FCL) -o zgemmtest $(LINK) zgemmtest.o random.o base.o $(LIB)
dgemmtest: dgemmtest.o base.o random.o $(INC)
$(FCL) -o dgemmtest $(LINK) dgemmtest.o random.o base.o $(LIB) 
ffttest: base.o smart_allocate.o mpi.o mgrid.o random.o ffttest.o $(FFT3D) $(INC)
$(FCL) -o ffttest $(LINK) ffttest.o mpi.o mgrid.o random.o smart_allocate.o base.o $(FFT3D) $(LIB)
kpoints: $(SOURCE) $(FFT3D) makekpoints.o main.F $(INC)
$(FCL) -o kpoints $(LINK) makekpoints.o $(SOURCE) $(FFT3D) $(LIB)


clean:
-rm -f *.g *.f *.o *.L *.mod ; touch *.F


main.o: main$(SUFFIX)
$(FC) $(FFLAGS)$(DEBUG)  $(INCS) -c main$(SUFFIX)
xcgrad.o: xcgrad$(SUFFIX)
$(FC) $(FFLAGS) $(INLINE)  $(INCS) -c xcgrad$(SUFFIX)
xcspin.o: xcspin$(SUFFIX)
$(FC) $(FFLAGS) $(INLINE)  $(INCS) -c xcspin$(SUFFIX)


makeparam.o: makeparam$(SUFFIX)
$(FC) $(FFLAGS)$(DEBUG)  $(INCS) -c makeparam$(SUFFIX)


makeparam$(SUFFIX): makeparam.F main.F 
base.o: base.inc base.F
mgrid.o: mgrid.inc mgrid.F
constant.o: constant.inc constant.F
lattice.o: lattice.inc lattice.F
setex.o: setexm.inc setex.F
pseudo.o: pseudo.inc pseudo.F
poscar.o: poscar.inc poscar.F
mkpoints.o: mkpoints.inc mkpoints.F
wave.o: wave.inc wave.F
nonl.o: nonl.inc nonl.F
nonlr.o: nonlr.inc nonlr.F


$(OBJ_HIGH):
$(CPP)
$(FC) $(FFLAGS) $(OFLAG_HIGH) $(INCS) -c $*$(SUFFIX)
$(OBJ_NOOPT):
$(CPP)
$(FC) $(FFLAGS) $(INCS) -c $*$(SUFFIX)


fft3dlib_f77.o: fft3dlib_f77.F
$(CPP)
$(F77) $(FFLAGS_F77) -c $*$(SUFFIX)


.F.o:
$(CPP)
$(FC) $(FFLAGS) $(OFLAG) $(INCS) -c $*$(SUFFIX)
.F$(SUFFIX):
$(CPP)
$(SUFFIX).o:
$(FC) $(FFLAGS) $(OFLAG) $(INCS) -c $*$(SUFFIX)




fft3dlib.o : fft3dlib.F
$(CPP)
$(FC) -FR  -O2 -c $*$(SUFFIX)
fft3dfurth.o : fft3dfurth.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


radial.o : radial.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


symlib.o : symlib.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


symmetry.o : symmetry.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


wave_mpi.o : wave_mpi.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


wave.o : wave.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


dynbr.o : dynbr.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


asa.o : asa.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


broyden.o : broyden.F
$(CPP)
$(FC) -FR  -O2 -c $*$(SUFFIX)


us.o : us.F
$(CPP)
$(FC) -FR  -O1 -c $*$(SUFFIX)


LDApU.o : LDApU.F
$(CPP)
$(FC) -FR  -O2 -c $*$(SUFFIX)


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章