一:需求:
大量處理文件夾下的excel文件,並進行excel文件去重,然後統計單個excel文件內容的信息(記錄--按要求選擇(基本設想實現處理姓名和電話號碼)),最後彙總所有文件的信息,保存在本地
二:需求分析:
1.對文件夾的打開並對所有文件進行處理
2.對excel文件的打開再對其中記錄進行處理
3.對excel文件中特殊記錄進行處理(比如手機號碼基本都是11位數字,身份證號碼基本是18位數字)
4.對數據進行分析處理(去重、統計)
5.得到結果,進行存儲(可以利用數據庫、excel進行保存)
三:語言和實現方向:
1.python
2.pandas(這算一個處理excel的庫吧)
3.處理excel的庫、處理文件資源的庫
4.數據庫和sql語句的使用
5.pyqt5實現簡單的界面
四:計劃開始:
1.時間:2019-04-05
2.團隊:目前一人--宋春豐
3.負責人:目前一人--宋春豐
4.最終目的在做的同時學習python和強大的pandas
5.預期實現時間(從現在開始兩個月--因爲還有學業和其他方面的事情、而且自己不是以做出軟件爲目的,畢竟能力不夠)
6.徵求像我一樣開始學python的孩子(本人大學生--想充分利用課餘時間)一起合作對此軟件的開發,一起交流一起學習
7.不要擔心自己不會就不敢去嘗試,不會肯定不是一直不會,不會只是你沒去做的時候纔不會,你開始做了不久會了嗎?
8.負責人介紹:最近寫出了一款比較簡單的可視化分析軟件(pyecharts、pyqt5、mysql),借鑑了很多別人的代碼,想再花點時間嘗試第二個軟件的開發
9.雖然不知道有沒有人用我這種思路寫過,但是這不重要,畢竟複製粘貼代碼可能都運行不了,只有自己去嘗試,纔會明白很多
10.提個小要求,也是唯一一個要求,別到困難就放棄,想清楚再考慮加入我(畢竟這個項目不是很大項目,做出來僅僅爲了學習)