解析Txt文件的過程

原創

2020-02-27 05:43

解析Txt文件的過程

項目需要解析用逗號(,)分隔的文本文件,然後將其中的數據轉換成xml文件進行導入到財務系統中....
考慮到以後可能文件格式會變化,因此使用了動態的創建方法,即通過格式文件來動態解析txt文件..本程序使用了apache的Digester來動態生成格式文件,使用CGLib動態生成目標類.步驟如下:
1、定義文件和字段的元數據格式,如果出現其他的文件格式只需要實現元數據接口即可..接口代碼:

java 代碼

public interface FileMeta {
public String getName();
public List<fieldmeta></fieldmeta> getFieldMeta();
}
public interface FieldMeta {
public String getName();
public String getType();
public int getLength();
public int getScale();
public String getComment();
public boolean isAllowNull();
}

通過兩個接口描述文件的屬性已經字段格式..

本例使用的是逗號分隔,如果出現其他分隔符怎麼辦?爲此,定義了一個分隔符接口:LineSpliter

java 代碼

public interface LineSpliter {
public String getSpliterRegx();
public String[] split(String lineData);
}

getSpliterRegx()同於返回當前的分隔符,split()用戶處理各行文本數據.
此處缺省實現了此接口,用於逗號分隔DefaultLineSpliter,定義如下:

java 代碼

public class DefaultLineSpliter implements {
public String defaultSpliterRegx = ",";
public String getSpliterRegx() {
return defaultSpliterRegx ;
}
public String[] split(String lineData) {
return StringUtils.splitPreserveAllTokens(lineData,defaultSpliterRegx );
}
}

這裏使用apache的Lang包進行處理,沒有使用JDK的String的split方法,因爲jdk的實現會將末尾空的字段過濾掉,造成數據減少...
比如:如果行數據爲aaa,bbb,,,,, 通過jdk的實現會返回aaa和bbb,而通過Lang包處理會返回包括後面空的字段.

2、接下來使用DigesterDigester包根據xml規則生成對象..
首先需要了解digester包的使用方法,這裏簡單的說一下:disgeter可以根據一定的規則將xml文件解析成一組對象...具體這裏,我先定義
一個規則文件,

xml 代碼

<digester-rules>
<pattern value='XXXFileMeta'>
<object-create-rule classname="com.xxx.file.DefaultFileMeta"/>
<set-properties-rule/>
<pattern value="field">
<object-create-rule classname="com.xxx.file.DefaultFieldMeta"/>
<set-properties-rule/>
<bean-property-setter-rule pattern="beanname1"/>
<bean-property-setter-rule pattern="beanname2"/>
<bean-property-setter-rule pattern="beanname3"/>
<bean-property-setter-rule pattern="beanname4"/>
pattern>
digester-rules>

這就是一個簡單的規則定義,具體含義這裏不詳細講了,想了解的可以給我回帖...
接着定義缺省的文件元數據文件,格式如下:

xml 代碼

<DefaultFileMeta name="com.xxx.file.DefaultFileMeta">
<field>
<beanname1>Codebeanname1>
<beanname2>Namebeanname2>
<beanname3>Datebeanname3>
<beanname4>Remakebeanname4>
field>
DefaultFileMeta>

最後實例化digester對象,加載規則文件,解析文件元數據文件,則會動態生成根據元數據文件解析的格式定義.

代碼如下:GeneratorObject.createObject(){}
初始化CGLib

java 代碼

@SuppressWarnings("unchecked")
private void init(Class target, FileMeta fileMeta) {
List<fieldmeta></fieldmeta> fields = fileMeta.getFieldMeta();
String[] getters = new String[fields.size()];
String[] setters = new String[fields.size()];
Class[] types = new Class[fields.size()];
try {
for (int i=0; i < fields.size(); i++) {
FieldMeta fieldMeta = fields.get(i);
getters[i] = "get" + ConverterUtils.upperCaseFirstChar(fieldMeta.getName());
setters[i] = "set" + ConverterUtils.upperCaseFirstChar(fieldMeta.getName());
types[i] = Class.forName(fieldMeta.getType());
}
} catch(ClassNotFoundException e) {
logger.error("類沒有找到.." + e.getMessage());
}
this.bulkBean = BulkBean.create(target, getters, setters, types);
}

根據指定的目標類動態生成對象

java 代碼

@SuppressWarnings("unchecked")
private Object createObject(Class target, FileMeta fileMeta, Object[] values) {
Object targetObject = null;
try {
targetObject = target.newInstance();
} catch (Exception e){
logger.error("創建對象出錯,目標類-->" + target.getName(), e);
}
bulkBean.setPropertyValues(targetObject, values);
return targetObject;
}

解析文本文件

java 代碼

@SuppressWarnings("unchecked")
public List createObjects() {
//初始化BulkBean
init(targetClass, fileMeta);
List result = new ArrayList();
LineIterator iterator = null;
try {
iterator = FileUtils.lineIterator(this.dataFile, DEF_ENCODING);
while(iterator.hasNext()) {
String line = iterator.nextLine();
//過濾掉數據文件中的空行
if (StringUtils.isBlank(line)) {
continue;
}
Object[] values = this.parseLine(line, fileMeta);
Object object = createObject(this.targetClass, fileMeta, values);
result.add(object);
}
} catch (IOException e) {
logger.error("讀取文件名出錯!-->" + this.dataFile.getName(), e);
} finally {
LineIterator.closeQuietly(iterator);
}
return result;
}

最終返回解析好的文本文件對象列表..
本例綜合使用了apache的代碼包,靈活實現了文本文件的解析...

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

解析Txt文件的過程

平臺開發技術考慮

搜狗拼音輸入法3.0預覽版出來了

(轉載)JavaFX應用問題解答

管理的鬆緊度

讓NetBeans6.0調試狀態應用新代碼的方法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結