中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
作者:
标题: 求助 wget或curl 抓取特殊网页 上一主题 | 下一主题
sady2009
初级用户





积分 58
发帖 60
注册 2009-2-18
状态 离线
『楼 主』:  求助 wget或curl 抓取特殊网页

想抓取下边这个地址中的某天节目预告.

例如: 2010-03-05日上午节目表

http://www.studytv.cn/Program/Schedule.aspx

用wget或curl 可以做到吗? 如何构建参数呢? 请高手指教,谢谢.

2010-3-2 09:46
查看资料  发短消息 网志   编辑帖子  回复  引用回复
lotus516
高级用户

论坛上抢劫的


积分 551
发帖 246
注册 2006-9-21
状态 离线
『第 2 楼』:  

用你说的工具,下下来分析关键字就可以了!

2010-3-2 12:05
查看资料  发送邮件  发短消息 网志   编辑帖子  回复  引用回复
sady2009
初级用户





积分 58
发帖 60
注册 2009-2-18
状态 离线
『第 3 楼』:  

谢谢回复,
我不是随便就发问的人,实际上
wget 和curl 教程都看过N遍了.也试过记不清多少次了,还是没有成功.

具体来说是:
wget -O 中学生.html --post-data=提交参数 http://www.studytv.cn/Program/Schedule.aspx

难点是提交参数如果构建.
网页部分源代码如下:
<div class="select_date">
                        选择日期<input name="ctl00$ContentPlaceHolder1$txtDate" type="text" value="2010/3/2" onchange="javascript:setTimeout('__doPostBack(\'ctl00$ContentPlaceHolder1$txtDate\',\'\')', 0)" onkeypress="if (WebForm_TextBoxKeyHandler(event) == false) return false;" id="ctl00_ContentPlaceHolder1_txtDate" style="width:100px;" />
                        <input type="image" name="ctl00$ContentPlaceHolder1$Image1" id="ctl00_ContentPlaceHolder1_Image1" src="../Library/Image/Calendar_scheduleHS.png" alt="Click to show calendar" style="height:16px;width:16px;border-width:0px;" />
                        
                        
                        <input type="submit" name="ctl00$ContentPlaceHolder1$butPeriod_2" value="上午(8:00-11:59)" id="ctl00_ContentPlaceHolder1_butPeriod_2" class="btn" />
                        <input type="submit" name="ctl00$ContentPlaceHolder1$butPeriod_3" value="下午(12:00-17:59)" id="ctl00_ContentPlaceHolder1_butPeriod_3" class="btn" />
                        <input type="submit" name="ctl00$ContentPlaceHolder1$butPeriod_4" value="晚上(18:00-23:59)" id="ctl00_ContentPlaceHolder1_butPeriod_4" class="btn" />
                    </div>
请帮忙分析一下. 如果我要抓取2010-3-5 上午 这个页面.--post-data= 后边的提交参数该如何写呢?

如果wget 或curl 做不到.还有其他方法吗? 比如vbs. js等也可以.本人只会一点bat. 请不吝赐教.谢谢

[ Last edited by sady2009 on 2010-3-2 at 17:00 ]

2010-3-2 16:19
查看资料  发短消息 网志   编辑帖子  回复  引用回复
sady2009
初级用户





积分 58
发帖 60
注册 2009-2-18
状态 离线
『第 4 楼』:  

有高手帮忙吗? 看来不好弄哦.

2010-3-3 16:43
查看资料  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: