网易首页 > 网易号 > 正文 申请入驻

爬取了644条公交线路,得出了两个结论——Python爬虫示例

0
分享至

  一、获取城市所有公交线路名

  以公交网上的所有公交线路为准,对比后发现,网址由三部分组成:城市拼音,不变的部分和数字。如果你想换成其他城市,改前面的部分即可。

  用xpath定位所有的公交线路名。

  通过for循环,获取1到9页的公交线路名字,添加append为列表类型。

  获取的公交线路名都是以城市名开头的,通过分割split函数去掉。

  总共获取了646条。

  二、获取公交线路基本信息

  Key需要到高德开放平台申请,免费,offset=1是单向,offset=2是双向。

  不过和上个月的上市公司地理编码不同的是,这回要选择的是Web端。

  返回的网页源代码是json格式。

  观察json文件的结构,公交线路有两个内容Object。

  buslines字段里,第一个元素是下行,第一个元素是上行。上下行的区分,好像是朝向火车站开的为上行,背离火车站方向的为下行,如果错误,请指正。

  根据不同的字段,获取公交线路上下行所属公司company、长度distance、线路名name、总价total_price和类型type。

  获取下行公交线路的函数,第9行判断下线路名是否为空,为空就跳过pass了。

  格式化函数format,把第一个参数城市名city替换为绿色箭头所指位置,把第二个参数公交线路名line替换为蓝色箭头所指位置,组成新的url。

  获取上行公交线路的函数,把0改为1就是上行。

  也可以组合在一起获取。

  测试下,看能否正常执行。

  三、获取城市所有公交线路的信息

  第2行的lines来自第一部分,第5行的函数get_line_down来自第二部分。

  实际上,前两个为空值,有效公交线路为644条。

  结尾

  1. 公交线路上下行长度不一样。

  2. 公交线路上下行所属的公司有可能不一样。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄乌战争中,两个鲜为人知的内幕!

俄乌战争中,两个鲜为人知的内幕!

史政先锋
2024-04-22 22:13:24
不幸中的万幸!ST宁科生物这个位置能逃出来,真是祖坟冒青烟了

不幸中的万幸!ST宁科生物这个位置能逃出来,真是祖坟冒青烟了

股海风云大作手
2024-04-25 08:03:49
张本兄妹被中国淘汰,谁注意张本父亲反应,对樊振东称呼改变有趣

张本兄妹被中国淘汰,谁注意张本父亲反应,对樊振东称呼改变有趣

东球弟
2024-04-24 16:07:34
火箭首轮归雷霆!抽中状元概率1.5%,达成这一条件,首轮仍归休城

火箭首轮归雷霆!抽中状元概率1.5%,达成这一条件,首轮仍归休城

熊哥爱篮球
2024-04-25 11:12:32
闹大了,苹果手机输入发现石油触发定位,网友:有卧底停止交易​

闹大了,苹果手机输入发现石油触发定位,网友:有卧底停止交易​

三月柳
2024-04-25 12:37:47
1990年,利比里亚总统多伊浑身赤裸地瘫坐在地上,他的十指被砍掉

1990年,利比里亚总统多伊浑身赤裸地瘫坐在地上,他的十指被砍掉

回京历史梦
2024-04-23 16:52:51
“长城炮”网红提车!30w定制版外观曝光太用心,评论区不淡定了

“长城炮”网红提车!30w定制版外观曝光太用心,评论区不淡定了

户外小阿隋
2024-04-24 21:27:33
恭喜张柏芝喜添小公主,大家都为她祝贺,网友们也为她点赞?

恭喜张柏芝喜添小公主,大家都为她祝贺,网友们也为她点赞?

娱乐圈酸柠檬
2024-04-25 06:42:45
第一眼就心动

第一眼就心动

农人老寓
2024-04-24 10:50:01
前孙杨外籍教练:我坚决捍卫中国游泳队的清白,阳性只因食物污染

前孙杨外籍教练:我坚决捍卫中国游泳队的清白,阳性只因食物污染

直播吧
2024-04-24 20:48:22
李纯、霍建华爆出大瓜!

李纯、霍建华爆出大瓜!

一剑化三亲
2024-04-25 10:36:24
火烧到莫斯科了!俄境内游击队喊话:这场战争只能在莫斯科结束

火烧到莫斯科了!俄境内游击队喊话:这场战争只能在莫斯科结束

娱宙观
2024-04-22 18:01:31
陈立人曾在华人论坛称:东北人妻子性格暴躁,多次扇他脸还报警

陈立人曾在华人论坛称:东北人妻子性格暴躁,多次扇他脸还报警

泸沽湖
2024-02-03 17:59:42
别轻易进厂?广西一00后打暑假工,被大8岁男生追到手,还怀孕了

别轻易进厂?广西一00后打暑假工,被大8岁男生追到手,还怀孕了

唐小糖说情感
2024-04-25 10:15:05
晴天霹雳! 广东男篮迎来3大坏消息! 广厦起死回生 , 辽篮观虎斗

晴天霹雳! 广东男篮迎来3大坏消息! 广厦起死回生 , 辽篮观虎斗

张阳讲体育
2024-04-24 16:08:59
中媒重磅警告:中国内地投资者“不可买卖”香港比特币现货ETF!

中媒重磅警告:中国内地投资者“不可买卖”香港比特币现货ETF!

FX168链界观察
2024-04-25 13:04:10
沉默了两天后,普京表示:俄罗斯的核武库比美国先进得多!

沉默了两天后,普京表示:俄罗斯的核武库比美国先进得多!

娱宙观
2024-04-23 20:45:46
【通报】涉嫌严重违纪违法,广东一卫生健康局局长被查!

【通报】涉嫌严重违纪违法,广东一卫生健康局局长被查!

粤卫人才
2024-04-25 12:43:44
华为Pura 70平息争议:已修复AI消除衣服Bug

华为Pura 70平息争议:已修复AI消除衣服Bug

PChome电脑之家
2024-04-25 10:24:54
嘉兴炒房客肠子都悔青了,嘉兴南湖区房价从19000元降至14000元

嘉兴炒房客肠子都悔青了,嘉兴南湖区房价从19000元降至14000元

有事问彭叔
2024-04-24 15:53:23
2024-04-25 16:58:46
学点新技能
学点新技能
介绍本人学到的技能
338文章数 5643关注度
往期回顾 全部

科技要闻

雷军:希望小米SU7能成为苹果用户购车首选

头条要闻

沙利文证实"美国向乌军提供远程导弹":我们将送去更多

头条要闻

沙利文证实"美国向乌军提供远程导弹":我们将送去更多

体育要闻

当胜利变成意外,就不要再提未来……

娱乐要闻

心疼!伊能静曝儿子曾被狗仔追到洗手间

财经要闻

曙光已现?瑞银开始转而看好中国地产业

汽车要闻

全新哈弗H9亮相 大号方盒子硬派SUV入列

态度原创

健康
手机
房产
教育
军事航空

这2种水果可降低高血压死亡风险

手机要闻

一季度中国手机市场报告出炉:荣耀/华为并列第一

房产要闻

涉及黄埔、番禺、增城!广州新一轮大规模征地启动

教育要闻

留学生“平静的疯感”从何而来?留学生不发Vlog,竟是怕人笑话?

军事要闻

俄美在安理会就外空核武器问题发生冲突

无障碍浏览 进入关怀版