Ⅰ robots.txt 应该阻止那些文件访问
robots.txt 应该阻止以下文件访问:
- 后台管理文件:如 /admin/ 目录下的文件,这些文件包含网站的管理后台,如果被搜索引擎抓取和索引,可能会暴露网站的管理接口,带来安全风险。
- 程序脚本:如 /require/ 或 /script/ 目录下的程序脚本文件,这些文件是网站运行的核心,通常不需要被搜索引擎抓取。
- 附件:如 /attachment/ 目录下的文件,这些文件通常是用户上传的内容,如文档、图片等,通常不需要被搜索引擎单独抓取。
- 数据库文件:如 /data/ 目录下的数据库文件,这些文件包含网站的数据,直接暴露给搜索引擎会带来严重的安全风险。
- 编码文件:如 /lang/ 目录下的编码文件,这些文件包含网站的国际化或本地化内容,通常不需要被搜索引擎抓取。
- 样式表文件:如 /css/ 目录下的样式表文件,这些文件定义网站的样式和布局,虽然对SEO有一定影响,但通常不需要被搜索引擎直接抓取。
- 模板文件:如 /template/ 目录下的模板文件,这些文件是生成网页内容的模板,不需要被搜索引擎抓取。
- 图片:虽然图片对SEO很重要,但某些图片,如导航图片和背景图片等,如果放在 /images/ 目录下,并且不希望被搜索引擎单独抓取,可以在robots.txt中阻止访问。但请注意,对于重要的、希望被搜索引擎抓取的图片,应该允许访问。
通过合理配置robots.txt文件,网站管理员可以确保搜索引擎蜘蛛只抓取和索引重要的网页内容,同时保护网站的安全和性能。
Ⅱ php网站后台地址是/index.php/admin,它最终访问的是网页目录里的什么文件
这样的话应该是框架模式的现实方法 比如zendframework 相当于php下的index.php?admin在一般MVC下意识是调用index.php这个引入文件 然后执行控制层adminController这个类 在zend框架里里的/号相当于=号 如 index.php/user/login/username/admin/passwrod/admin1就是执行USER类下的login方法 用户名=admin 密码=admin1。