利用HttpClient获取网页内容
官方主页:http://hc.apache.org/httpclient-3.x/转自:http://www.cnjm.net/tech/article1153.html代码如下:import java.io.BufferedReader;import java.io.InputStreamReader;import java.io.UnsupportedEncodingExc
官方主页:http://hc.apache.org/httpclient-3.x/
转自:http://www.cnjm.net/tech/article1153.html
代码如下:
之后,就可以通过下面的代码获得目标网页:
String source = HttpClientExample.getGetResponseWithHttpClient("http://www.163.com", "GBK");
注意,在默认情况下,HttpClient的Request的Head中
User-Agent的值是Jakarta Commons-HttpClient 3.0RC1,如果需要改变它(例如,变为Mozilla/4.0),必须在调用之前运行如下语句:
System.getProperties().setProperty("httpclient.useragent", "Mozilla/4.0");

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。
更多推荐
所有评论(0)