Android網絡閱讀器_jsoup解析應用

這是一款通過jsoup解析Html獲取內容的網絡閱讀器，大學時期閒暇完成，對照CSDN的Web頁面元素設計進行解析提取內容，核心功能就是使用jsoup解析。以下是相關截圖：

下載地址：http://tcl.anzhi.com/soft_450735.html http://www.nduoa.com/apk/detail/444229

開源地址：https://github.com/weiyirong/HappyReader

核心解析代碼：

package com.weiyi.itreader.util;

import java.util.ArrayList;
import java.util.List;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import android.util.Log;

import com.weiyi.itreader.common.Constant;
import com.weiyi.itreader.entity.ITBlog;

/**
 * 功能：ITBlog獲取工具，通過URL解析html獲取網絡文章各項信息,主要用到html解析工具Jsoup
 * 
 * @author moho
 * */
public class ITBlogUtil {
	/**
	 * 獲取文章列表
	 * 
	 * @param url
	 *            請求的ＵＲＬ
	 * @return List<ITBlog> IT閱讀文章列表
	 * */
	public static List<ITBlog> getITBlogList(String url) {
		List<ITBlog> itBlogs = new ArrayList<ITBlog>();
		try {
			Document doc = Jsoup.connect(url).get();
			Elements titles = doc.getElementsByClass(
					Constant.ITBLOG_TITLE_CLASS).tagName("a");// 獲取所有class=link_title的標籤元素
			Elements dates = doc.getElementsByClass(Constant.ITBlOG_DATE_CLASS);
			Elements urls = titles.select(Constant.HREF_SELECT);
			for (int i = 0; i < titles.size(); ++i) {
				String blogUrl = Constant.ITBLOG_URL
						+ urls.get(i).attributes().get("href");// 每篇文章的URL
				String iconUrl = getIconUrlByBlogUrl(blogUrl);
				ITBlog itBlog = new ITBlog();
				if (iconUrl != null)
					itBlog.setIconUrl(iconUrl);// 設置每篇文章的頭圖標URL
				itBlog.setTilte(titles.get(i).text());// 獲取a標籤內的文本，即文章標題
				itBlog.setDate(dates.get(i).text());// 獲取文章發表日期
				itBlog.setUrl(blogUrl);// 獲取超鏈接屬性href的值
				itBlogs.add(itBlog);
			}
		} catch (Exception e) {
			e.printStackTrace();
		}
		return itBlogs;
	}

	/**
	 * 獲取文章內容
	 * 
	 * @param url
	 *            請求的ＵＲＬ
	 * @return String IT閱讀文章內容
	 * */
	public static String getContentByURL(String url) {
		String content = "";
		try {
			Document doc = Jsoup.connect(url).get();
			Element contentElement = doc
					.getElementById(Constant.ITBlOG_CONTENT_ID);
			content = contentElement.html();
		} catch (Exception e) {
			e.printStackTrace();
			return content;
		}
		return content;
	}

	/**
	 * 獲取文章圖標,根據文章的URL地址解析img標籤獲取src屬性值
	 * 
	 * @param blogUrl
	 *            請求的文章ＵＲＬ
	 * @return String IT閱讀文章圖標URL
	 * */
	public static String getIconUrlByBlogUrl(String blogUrl) {
		String iconUrl = null;
		try {
			Document doc = Jsoup.connect(blogUrl).get();
			Element contentElement = doc
					.getElementById(Constant.ITBlOG_CONTENT_ID);// 獲取內容區
			Elements imgElements = contentElement.getElementsByTag("img");
			if(imgElements.size()>0)
			   iconUrl = imgElements.get(0).attributes().get("src");// 獲取UIRL,默認取第一個遇到的img的URL
		} catch (Exception e) {
			e.printStackTrace();
		}
		return iconUrl;
	}
}

Android網絡閱讀器_jsoup解析應用

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

Android代碼調用setBackgroundResource引起的Padding問題

IMSdroid視頻馬賽克問題

中國天氣網API無法更新

Android IT資訊網絡閱讀器_jsoup解析

動態佈局中RadioGroup的RadioButton有時候不互斥的原因

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結