代码如下:
#注意:本电脑环境是Python3.7#下面是导入相应模块importrequests#导入requests库frombs4importBeautifulSoup#导入解析库importpandasaspd#下面是网页请求url="http://q.stock.sohu.com/"#设置请求网址为搜索网址response=requests.get(url)#对搜狐网站就行get请求并将请求结果赋值给responseresponse.encoding='utf-8'#设置编码为utf-8格式的html=response.text#获取网页的html源代码并赋值给html#下面是网页解析soup=BeautifulSoup(html,'lxml')#将lxml解析为htmlcontent=soup.findAll('a')#查找所有的a标签内容并赋值给contentforaaincontent:#遍历查到的的a标签内容print(aa.get('href'))#获取ahref后面的网址,并打印出来#下面是保存数据df=pd.DataFrame(content,columns=["网址"])#设置列标为网址,单元格数据为content内容df.to_excel("搜索a标签内容.xlsx")#将df数据存入搜索a标签内容.xlsx中
运行结果如下:
/
//s.m.sohu.com/t/index.html
//q.stock.sohu.com/feedback.html
//q.stock.sohu.com/cn/mystock.shtml
//q.stock.sohu.com/cn/bk.shtml
//q.stock.sohu.com/cn/ph.shtml
//q.stock.sohu.com/cn/zs.shtml
//q.stock.sohu.com/fundflow/
/sdk/rank
//stock.sohu.com/ipo/
//q.stock.sohu.com/App2/bigdeal2.jsp
//q.stock.sohu.com/app2/rpsholder.up
//q.stock.sohu.com/app2/mpssTrade.up
//stock.sohu.com/s2011/jlp/
//q.fund.sohu.com/jzph/zxjz_date_up.shtml
//q.stock.sohu.com/us/zgg.html
JAVAscript:void(0);
/sdk/transfer?page=callin
/sdk/transfer?page=callin
/sdk/transfer?page=callout
/sdk/transfer?page=cancel
/sdk/transfer?page=record
//mp.sohu.com
JavaScript:void(0);
javascript:void(0);
javascript:void(0);
//q.stock.sohu.com/cn/ph_m.shtml?type=sh_as&field=changerate&sort=up
//q.stock.sohu.com/cn/ph_m.shtml?type=sz_as&field=changerate&sort=up
//q.stock.sohu.com/cn/bk.shtml
//q.stock.sohu.com/cn/bk.shtml
//q.stock.sohu.com/cn/bk.shtml
//q.stock.sohu.com/cn/bk.shtml
javascript:void(0);
javascript:void(0);
/sdk/rank
//q.stock.sohu.com/cn/mystock.shtml
javascript:void(0);
//q.stock.sohu.com/fundflow/stock_inflow.html?name=NetVal&io=In
//q.stock.sohu.com/fundflow/stock_inflow.html?name=NetVal&io=Out
//q.stock.sohu.com/app2/mpssTrade.up
//q.stock.sohu.com/app2/mpssTrade.up
//q.stock.sohu.com/app2/bigdeal2.jsp
图片示例如下:
搜索引擎喜欢什么样的网站
网站在搜索引擎的排名是由什么决定的?搜索引擎喜欢什么类型的网站?
1.网站结构设计合理,文字,图片须有标记,同时还是照顾用户体验。
一个好的网站不应该像一个迷宫,对用户不友好的网站自然搜索引擎也不会觉得是好网站。一个结构清晰合理的网站不单访客喜欢,搜索引擎同样喜欢。除了看得见的工作,还有一些编码层面上的工作是访客看不到的东西,这些是由编程人员为搜索引擎准备的,是程序与程序之间的沟通,当然根本目的还是迎合用户,在搜索结果的时候提供匹配更精准的优质网站。就比方说img标签应该配有tag属性,网站导航结构合理等等。
2.域名简短,有含义,根本是客户好记。
严格地说计算机看待任何一个域名都是一样的由字符串组成的网络地址,那么为什么搜索引擎更喜欢简短,有含义的地址呢,这是站在用户的角度思考问题:一个好的网站应该使用一个易记,容易理解的域名——也就是地址,无论是从审美还是传播角度还是品牌性上都优于又长又复杂的地址。
3.关键词分配应为树形结构,切忌多而全。
这一方面是比较专业的优化技巧,因为通常一个网站想吸引的目标客户会使用不同的搜索词在百度等搜索引擎上搜索,显然将所有的搜索词都安排在首页是不合理的,一是在页面设计上不够美观,二是每个网站的每个页面获得的权重不会随着关键词的增多而增多,相反会稀释权重,合理的分配关键词在网站的每一个页面上是必要的,最佳的关键词分配结构是树形结构,主关键词集中在首页,次要关键词在分类文章页或固定页面,长尾便可分配到文章页或其他。这就需要在建站开始对关键词进行选择和分配。
4.网站首页要有最新内容,提高新文章权重。
网站产生的最新内容应该在首页得到尽可能的展示,这就好比一个有机的团体在向世人和搜索引擎展示自己最新的成果和内容一样,这样有利于搜索引擎的收录,也让用户和搜索引擎知道这是一个“活着”的网站,搜索引擎自然会喜欢一个“活着”的网站。
5.选一个快速的服务器。
一个快速的服务器无疑对访客和搜索引擎都是友好的,想象打开一个网站,5秒甚至10秒才看得到内容,很多人还没等打开就已经关闭了,这种网站内容再好,也没有展示的机会。
6.能备案最好。
备案真正的好处是可以使用国内的主机,想用国内主机来当网站服务器一个硬性规则就是域名备案,另外某种程度备过案的域名感觉会让人放心一些,但这只是“感觉上”,所以搜索引擎也不会傻到不备案就不收录,或者没有好排名。
7.框架整理好之前不能上线。
一个没有建设好的网站最好不要上线,当搜索引擎来到你的网站的时候发现和上次有很大不同,我指的是结构不同,不是内容不同,这样搜索引擎会认为你的网站还没有准备好,那么就会对你抱持一种怀疑态度,这样得不偿失,想重新获得信任就需要更长的一段时间,这样得不偿失,所以seo之家提醒网站制作者,在网站结构修改好之前不要上传至空间服务器,与“大家”见面。
8.上线后陆续发布文章,不需全部发好。
网站建设完成准备上线之前,建议不要把所有文章全部发布。在上线之后搜索引擎有了收录之后,逐日发布文章,这样可以减少上线后的发布工作,像之前说的,搜索引擎喜欢经常有新内容的网站,当然如果你的文章写手够出色,可以忽略这条,总之上线后一定要有陆续的内容更新,比如本站的文章更新频率为每天一篇原创。
9.少用iframe和flash等。
搜索引擎的理解能力有限,不要给他们增加额外的负担,即使使用了flash,访客会很喜欢精美的动画,但是搜索引擎完全看不懂!适量的使用还是可以的。
10.切忌堆砌关键字。
不要为搜索引擎去做一个网站,一些作弊手段只能让搜索引擎越来越讨厌自己,所谓过犹不及,过度优化会是带来一定惩罚的。
11.写原创文章。
原创的文章是搜索引擎喜欢的优质内容。为了防止千篇一律,天下文章尽相同的搜索结果,搜索引擎对于原创文章和站点有着格外的关爱,坚持每天写一篇原创文章是一个好的SEOer应具备的素质。
以上的总结只能算是基本知识,真正要做一个搜索引擎喜欢的网站,还有需多的知识需要学习掌握,但任何事情都需要从基本知识开始,只有了解掌握了基本内容我们才能深入研究,相信每一个人通过努力学习才能制作出一个搜索引擎喜欢的网站。
信息转载自网络,更多相关信息请点击:http:///
相关文章
热门标签
-
Google 按图搜索的原理 怎样才能让搜索引擎爱上你的网站?
2024-03-21 18:08
-
如何构建Google搜索自动完成功能 搜索引擎的爬取标准 网站提升一定要懂
2024-03-21 18:08
-
搜索引擎高级命令site的两种用法和注意事项 搜索引擎是怎样工作?
2024-03-21 18:08
-
收录和索引究竟“谁”是搜索引擎的“亲儿子”? 解析影响搜索引擎蜘蛛访问网站的原因
2024-03-21 18:08
-
如何判断网站是否被搜索引擎惩罚 搜索引擎为何打击外链交换平台?
2024-03-21 18:08
-
什么是搜索引擎?搜索引擎的定义 移动搜索及优化的方法
2024-03-21 18:08
-
搜索引擎如何运作?实际做什么? 百度与谷歌搜索机制十大区别
2024-03-21 18:08
-
国外google seo大牛分析了100万个搜索结果得出的影响排名的因素 从搜索引擎遇到的挑战来学习SEO
2024-03-21 18:08
-
搜索引擎算法:谷歌算法 分类目录与搜索引擎的关系
2024-03-21 18:08
-
程序员常用的搜索引擎工具 百度搜索引擎蜘蛛详解
2024-03-21 18:08
-
社交媒体营销vs搜索营销的趋势在哪里? 搜索引擎相关性计算
2024-03-21 18:08
-
无需手动输入,零搜索引擎把信息主动推给你 百度搜索账户搭建实操,超细致讲解
2024-03-21 18:08
-
百度搜索引擎细雨算法2.0正式上线 搜索引擎的基本架构
2024-03-21 18:08
-
搜索引擎不收录网站原因有哪些 搜索引擎排名过程简述
2024-03-21 18:08
-
Seo能给独立站带来巨大的搜索流量吗? 从网页建库来摸清搜索引擎排名核心规律
2024-03-21 18:08
-
百度搜索新匹配模式“新”在哪里?本篇带你全面解读 谷歌开源robots.txt 欲引领搜索引擎爬虫的行业标准
2024-03-21 18:08
-
被搜索引擎K过的网站,排名还能恢复吗? 深入搜索引擎原理
2024-03-21 18:08
-
如何利用百度搜索有效加粉?可复制型实战案例解析 搜索引擎算法大全-(百度+360+搜狗)
2024-03-21 18:08
-
黑客技术:怎么利用现有搜索引擎查找想要的东西?学会这招很管用 SEM搜索引擎营销解读,这份报告你必须要有
2024-03-21 18:08
-
信息“爆炸”时代,搜索引擎是如何工作的? SEO网络推广常用的有哪些搜索命令?
2024-03-21 18:08