vasp 編譯

首先參考

文章：http://blog.sciencenet.cn/blog-211012-593362.html

以及：http://bbs.csdn.net/topics/260015576
http://blog.sciencenet.cn/blog-548663-796287.html

建議：現在最新版本的intel編譯器parallel studio包含mpi庫，BLAS、LAPACK以及FFT3D，在Intel的機器上，建議統一使用INTLE自家的算法庫，這樣可以保證速度不至於出問題。

第一篇文章裏提到的，vasp安裝的前提條件

1、vasp源碼包

vasp.5.2.tar.gz ## vasp 源代碼
vasp.5.lib.tar.gz ## vasp提供的lapack

2、編譯器

比如： Intel fortran 11.1(帶MKL庫)

3、blas庫

Intel 編譯器帶有，也可以使用GotoBLAS2(http://www.tacc.utexas.edu/tacc-projects/gotoblas2/downloads)

gotoblas2庫編譯：
#tar -xvzf GotoBLAS2-1.13.tar.gz
#cd GotoBLAS2
#make TARGET=NEHALEM （可以選擇make CC=icc FC=ifort BINARY=64 TARGET=NEHALEM）

成功會有提示：GotoBlas build complete
於是得到了libgoto2_nehalemp-r1.13.a這個文件，在makefile裏面相應的寫法是BLAS= (路徑)/GotoBLAS2/libgoto2_nehalemp-r1.13.a

4、lapack庫

Intel 編譯器帶有，也可以使用vasp提供的lapack

5、mpi

可以使用openmpi，也可以使用mpich2（安裝請百度，或者查看官方網站）
http://www.open-mpi.org/
http://phase.hpcc.jp/mirrors/mpi/mpich2/

6、FFTW (vasp代碼自帶有，優化選項是可選的)

Intel 編譯器帶有，但是需要自己編譯，可以使用FFTW 3.2.2 (http://www.fftw.org/)

FFTW lapack-3.5.0編譯
#tar -xvzf lapack-3.5.0.tgz
#cd lapack-3.5.0
#mkdir (安裝目錄)
#./configure --prefix=(安裝目錄)
#make
#make install

於是在(安裝目錄)裏面有lib、include等文件夾，其中lib包含的libfftw3.a以及include裏面的頭文件是需要被調用的，相應的makefile的寫法

FFT3D = fftmpi.o fftmpi_map.o fftw3d.o fft3dlib.o (安裝目錄)/lib/libfftw3.a

以及

FFLAGS = -I(安裝目錄)/include/ -FR -lowercase -assume byterecl

-------------------------------------------------------------------------------------------------------------------

下面記錄我的編譯過程

編譯環境：centos 6.0，Intel fortran/c++ compoler 11.1 with mkl，mpich2(build with intel)

1、編譯vasp提供的lapack
#tar -xvzf vasp.5.lib.tar.gz
#cd vasp.5.lib
#cp makefile.linux_ifc_P4 makefile

修改makefile裏面的FC=ifort
#make

2、編譯Intel自帶的FFTW

#cd /opt/intel/Compiler/11.1/075/mkl/interfaces/fftw3xf 這個目錄根據實際情況修改
#make libem64t F=intel precision=MKL_DOUBLE 於是產生了libfftw3xf_intel.a

3、編譯vasp

#tar -xvzf vasp.5.2.tar.gz
#cd vasp.5.2
#cp makefile.linux_ifc_P4 makefile

然後修改makefile裏面的內容
-----------------------------------

FC=/opt/mpich2-intel-11/bin/mpif90
##FC是編譯器路徑，如果需要並行，那麼就選擇相應mpi的路徑，串行FC=ifort就行

BLAS= -L/opt/intel/Compiler/11.1/075/mkl/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lguide -lpthread
##使用Intel的blas庫，注意前面的-L，每一個參數表示指定目錄下有一個相應的.a/.so文件

LAPACK= ../vasp.5.lib/lapack_double.o
##使用vasp自帶的lapack，注意要先編譯好(../vasp.5.lib/lapack_double.o這個文件存在)

##如果使用Intel的lapack則

LAPAC= -L/opt/intel/Compiler/11.1/075/mkl/lib/em64t -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lguide -lpthread

CPP = $(CPP_) -DMPI -DHOST=\"LinuxIFC\" -DIFC \
-Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc -DNGZhalf \
-DMPI_BLOCK=8000
##這個是並行的CPP 參數形式

LIB = -L../vasp.5.lib -ldmy \
../vasp.5.lib/linpack_double.o $(LAPACK) \
$(SCA) $(BLAS)
##這個我沒動

FFT3D = fftmpi.o fftmpi_map.o fft3dfurth.o fft3dlib.o /opt/intel/Compiler/11.1/075/mkl/interfaces/fftw3xf/libfftw3xf_intel.a
##並行需要的FFT3D注意後面那個文件是要提前編譯好的，如果不使用這個文件，可以將其註銷
--------------------------------------------------------------------------------------
對於串行程序，基本上只要修改FC和BLAS的路徑就行了。

運行vasp的時候要在環境變量裏面添加mkl以及mpi的路徑，比如在.bashrc裏添加
PATH=/opt/intel/Compiler/11.1/075/bin/intel64:/opt/openmpi-intel11/bin/:$PATH
LD_LIBRARY_PATH=/opt/intel/Compiler/11.1/075/lib/intel64:/opt/intel/Compiler/11.1/075/mkl/lib/intel64:/opt/openmpi-intel11/lib/:$LD_LIBRARY_PATH

總結：隨着對編譯的瞭解，會慢慢熟悉這個文件的內容，平時參考的各種人的筆記由於版本和環境等問題，可能無法在自己的環境里正確工作，結合實際情況和參考官方檔案在這個時候是可以多做做的。

順便提一下NEB的編譯

首先到官方網站下載：http://theory.cm.utexas.edu/vasp/downloads/
並按照官網的提示修改main.f以及makefile，以及要將源代碼文件拷貝到vasp編譯目錄（注意每次make clean後這些文件就被刪除了，要重新拷貝），還有需要注意的是不要弄錯版本。

----vasp 運行段錯誤問題
在FLAG的選項中加入: -heap-arrays 64 試試看

---- 找不到庫文件，但是這個庫文件能locate到
在/etc/ld.conf 或者 /etc/ld.conf.d/xx.conf裏面添加庫路徑，然後 sudo ldconfig
---- mpirun 需要啓動mpd，在用戶家目錄建立一個.mpd.conf，然後mpd --daemon
---- Intel 編譯器 2014 （13.n）的問題，貌似沒有帶mpi的某些函數，解決辦法是安裝2013（12.n）或者是安裝2015

----相關優化問題，待研究。。。。

#############貼上一個並行版本的vasp編譯文件#############

.SUFFIXES: .inc .f .f90 .F

SUFFIX=.f90

CPP_ = ./preprocess <$*.F | /usr/bin/cpp -P -C -traditional >$*$(SUFFIX)

FFLAGS = -I/share/apps/fftw/include -FR -assume byterecl -heap-arrays 64

OFLAG=-O3

OFLAG_HIGH = $(OFLAG)
OBJ_HIGH =
OBJ_NOOPT =
DEBUG = -FR -O0
INLINE = $(OFLAG)

LIB = -L../vasp.5.lib -ldmy \
../vasp.5.lib/linpack_double.o $(LAPACK) \
$(BLAS)

LINK =

FC=mpif77

CPP = $(CPP_) -DMPI -DHOST=\"LinuxIFC\" -DIFC \
-Dkind8 -DCACHE_SIZE=4000 -DPGF90 -Davoidalloc -DNGZhalf \
-DMPI_BLOCK=8000

MKLPATH=/share/apps/intel/composer_xe_2015.1.133/mkl/lib/intel64

LAPACK=
BLAS= -L$(MKLPATH) -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lpthread
SCA=

LIB = -L../vasp.5.lib -ldmy \
../vasp.5.lib/linpack_double.o $(LAPACK) \
$(SCA) $(BLAS)

FFT3D = fftmpi.o fftmpi_map.o fftw3d.o fft3dlib.o /share/apps/fftw/lib/libfftw3.a

BASIC= symmetry.o symlib.o lattlib.o random.o

SOURCE= base.o mpi.o smart_allocate.o xml.o \
constant.o jacobi.o main_mpi.o scala.o \
asa.o lattice.o poscar.o ini.o xclib.o xclib_grad.o \
radial.o pseudo.o mgrid.o gridq.o ebs.o \
mkpoints.o wave.o wave_mpi.o wave_high.o \
$(BASIC) nonl.o nonlr.o nonl_high.o dfast.o choleski2.o \
mix.o hamil.o xcgrad.o xcspin.o potex1.o potex2.o \
metagga.o constrmag.o cl_shift.o relativistic.o LDApU.o \
paw_base.o egrad.o pawsym.o pawfock.o pawlhf.o paw.o \
mkpoints_full.o charge.o dipol.o pot.o \
dos.o elf.o tet.o tetweight.o hamil_rot.o \
steep.o chain.o dyna.o sphpro.o us.o core_rel.o \
aedens.o wavpre.o wavpre_noio.o broyden.o \
dynbr.o rmm-diis.o reader.o writer.o tutor.o xml_writer.o \
brent.o stufak.o fileio.o opergrid.o stepver.o \
chgloc.o fast_aug.o fock.o mkpoints_change.o sym_grad.o \
mymath.o internals.o dimer_heyden.o dvvtrajectory.o vdwforcefield.o \
hamil_high.o nmr.o force.o \
pead.o subrot.o subrot_scf.o pwlhf.o gw_model.o optreal.o davidson.o \
electron.o rot.o electron_all.o shm.o pardens.o paircorrection.o \
optics.o constr_cell_relax.o stm.o finite_diff.o elpol.o \
hamil_lr.o rmm-diis_lr.o subrot_cluster.o subrot_lr.o \
lr_helper.o hamil_lrf.o elinear_response.o ilinear_response.o \
linear_optics.o linear_response.o \
setlocalpp.o wannier.o electron_OEP.o electron_lhf.o twoelectron4o.o \
ratpol.o screened_2e.o wave_cacher.o chi_base.o wpot.o local_field.o \
ump2.o bse.o acfdt.o chi.o sydmat.o

INC=

vasp: $(SOURCE) $(FFT3D) $(INC) main.o
rm -f vasp
$(FCL) -o vasp main.o $(SOURCE) $(FFT3D) $(LIB) $(LINK)
makeparam: $(SOURCE) $(FFT3D) makeparam.o main.F $(INC)
$(FCL) -o makeparam $(LINK) makeparam.o $(SOURCE) $(FFT3D) $(LIB)
zgemmtest: zgemmtest.o base.o random.o $(INC)
$(FCL) -o zgemmtest $(LINK) zgemmtest.o random.o base.o $(LIB)
dgemmtest: dgemmtest.o base.o random.o $(INC)
$(FCL) -o dgemmtest $(LINK) dgemmtest.o random.o base.o $(LIB)
ffttest: base.o smart_allocate.o mpi.o mgrid.o random.o ffttest.o $(FFT3D) $(INC)
$(FCL) -o ffttest $(LINK) ffttest.o mpi.o mgrid.o random.o smart_allocate.o base.o $(FFT3D) $(LIB)
kpoints: $(SOURCE) $(FFT3D) makekpoints.o main.F $(INC)
$(FCL) -o kpoints $(LINK) makekpoints.o $(SOURCE) $(FFT3D) $(LIB)

clean:
-rm -f *.g *.f *.o *.L *.mod ; touch *.F

main.o: main$(SUFFIX)
$(FC) $(FFLAGS)$(DEBUG) $(INCS) -c main$(SUFFIX)
xcgrad.o: xcgrad$(SUFFIX)
$(FC) $(FFLAGS) $(INLINE) $(INCS) -c xcgrad$(SUFFIX)
xcspin.o: xcspin$(SUFFIX)
$(FC) $(FFLAGS) $(INLINE) $(INCS) -c xcspin$(SUFFIX)

makeparam.o: makeparam$(SUFFIX)
$(FC) $(FFLAGS)$(DEBUG) $(INCS) -c makeparam$(SUFFIX)

makeparam$(SUFFIX): makeparam.F main.F
base.o: base.inc base.F
mgrid.o: mgrid.inc mgrid.F
constant.o: constant.inc constant.F
lattice.o: lattice.inc lattice.F
setex.o: setexm.inc setex.F
pseudo.o: pseudo.inc pseudo.F
poscar.o: poscar.inc poscar.F
mkpoints.o: mkpoints.inc mkpoints.F
wave.o: wave.inc wave.F
nonl.o: nonl.inc nonl.F
nonlr.o: nonlr.inc nonlr.F

$(OBJ_HIGH):
$(CPP)
$(FC) $(FFLAGS) $(OFLAG_HIGH) $(INCS) -c $*$(SUFFIX)
$(OBJ_NOOPT):
$(CPP)
$(FC) $(FFLAGS) $(INCS) -c $*$(SUFFIX)

fft3dlib_f77.o: fft3dlib_f77.F
$(CPP)
$(F77) $(FFLAGS_F77) -c $*$(SUFFIX)

.F.o:
$(CPP)
$(FC) $(FFLAGS) $(OFLAG) $(INCS) -c $*$(SUFFIX)
.F$(SUFFIX):
$(CPP)
$(SUFFIX).o:
$(FC) $(FFLAGS) $(OFLAG) $(INCS) -c $*$(SUFFIX)

fft3dlib.o : fft3dlib.F
$(CPP)
$(FC) -FR -O2 -c $*$(SUFFIX)
fft3dfurth.o : fft3dfurth.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)

radial.o : radial.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)

symlib.o : symlib.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)

symmetry.o : symmetry.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)

wave_mpi.o : wave_mpi.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)

wave.o : wave.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)

dynbr.o : dynbr.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)

asa.o : asa.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)

broyden.o : broyden.F
$(CPP)
$(FC) -FR -O2 -c $*$(SUFFIX)

us.o : us.F
$(CPP)
$(FC) -FR -O1 -c $*$(SUFFIX)

LDApU.o : LDApU.F
$(CPP)
$(FC) -FR -O2 -c $*$(SUFFIX)

《日本蠟燭圖》讀書筆記 & 技術分析回測

《期貨-市場技術分析》讀書筆記

Python多線程編程深度探索：從入門到實戰

mongodb處理json數據很好

[轉帖]cpupower

35K*14 薪，入職了！這公司只要不裁員，我能一直呆下去！

Windows 下製作 mac os 的優盤啓動

Windows下用 Code blocks + mingw 搭建 Fortran 編譯環境

ubuntu 18.04 編譯vasp 5.4

ghigli logo ploted by matlab

grub4dos引導的U盤啓動盤

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結