根据题主的步骤,请题主思考以下几个写于
括号内问题
:1. 登录网页(涉及输入用户名密码并登录个人帐号吗?)
2. 点击按钮转到另一个页面(这另一个页面可以直接访问吗?为何需要点击按钮跳转?)
3. 提交搜索条件,得出一些条目(搜索条件固定吗?如果会变动会有哪些变动?条件多样吗?)
4. 对这些条目进行修改,然后保存(对搜索出来的结果进行修改,我猜测第一步是用到登录了对吧?)
5. 点击每一个条目,跳转到条目的详细页面,然后在里面填些东西,submit。(这一条和第4条的区别在哪里?还是指的同一个操作?)
根据以上步骤,
猜测
题主需要了解的知识有:1、一个正常的http请求,由浏览器发起是如何产生的?由程序发起是如何产生的?服务器如何响应这个请求的?即
Request/Response过程中涉及的相关内容
。2、服务器和浏览器如何协作,确定认可某用户的身份?即
Cookie、Header等方面的内容
。3、找到结果后,如何一一进行修改?程序如何找到指定某块的内容的?即
DOM、正则等方面的内容
。4、对搜索条件、修改内容进行抽象化,并用程序实现这些抽象,如时间,类别,关键字进行搜索,目标对象使用某个规则程序自动产生内容进行修改,如有暂时存储的必要,
可能需要用到数据库
。作为没有太多编程经验的人来说,这些东西还是有一定难度的。题主可以先从HTTP开始学起,搞明白不用程序,浏览器是怎么跟服务器打交道的。然后再思考如何使用程序模拟浏览器行为和服务器打交道。最后再考虑如何高效快速的和服务器打交道,也就是使用一些python库。