likes
comments
collection
share

0 到 1 搭建 GPTs 导航站(一):如何收录 GPTs

作者站长头像
站长
· 阅读数 49

0 到 1 搭建 GPTs 导航站(一):如何收录 GPTs

0 到 1 搭建 GPTs 导航站系列:

前言

0 到 1 搭建 GPTs 导航站(一):如何收录 GPTs

概括来说过去三个月主要做了如下事情:

  1. 学习爬虫,收集了 3w 个 GPTs
  2. 使用 cloudflare CDN 等方式提高网站访问速度
  3. 使用各种策略,优化SEO
  4. 接入 Google Search Console、GA4、Clarity Microsoft 等工具跟踪网站流量
  5. 到 V2EX、Product Hunt、Reddit 等平台推广

网站运营情况如下:

  • 被谷歌收条 2.7w 条

0 到 1 搭建 GPTs 导航站(一):如何收录 GPTs

  • 流量,100 多个人访问过

0 到 1 搭建 GPTs 导航站(一):如何收录 GPTs

而今天,主要跟大家分享一下很多人最关心的问题,如何搭建网站和收录 GPTs。分享一下这个过程自己遇到什么问题,然后是怎样解决的。对于技术人员比较好理解,非技术人员也可以作为借鉴。

项目搭建

直接用 gpts.works ,按照文档部署到 Vercel 使用即可,超方便。

爬取推特 GPTs 搜索结果

0 到 1 搭建 GPTs 导航站(一):如何收录 GPTs

于是按着 GPTs hunter 作者的思路写了两个爬虫脚本,大家可以直接拿去用:

  1. 从推特上爬取 GPTs 链接
  2. 从 ChatGpt 上爬取 GPTs 详情

爬取谷歌 GPTs 搜索结果

当然,网上还有很多人提到可以在谷歌搜索 site:chat.openai.com/g/ ,过滤出 GPTs 链接。

0 到 1 搭建 GPTs 导航站(一):如何收录 GPTs

研究了一下谷歌搜索,如果自己写脚本请求翻页可以这样搞 https://google.com/search?q=Query&num=10&start=0 。但是会有两个问题,第一是速率太快会被会被弹人机验证,所以别请求太快。另一个就是,谷歌虽然告诉你它收录了 49 万条数据,但实际上你可以浏览的也就只有前 10 几页,再往下滑你会发现到底了,滑不动了,用接口请求也会有同样的问题。

在搜索 API 加上时间参数,限制搜索时间就可以解决这个问题。完整 API 参数如下:

https://google.com/search?q=Query&num=10&start=0&tbs=encodeURIComponent(cdr:1,cd_min:1/1/2024,cd_max:1/2/2024)
转载自:https://juejin.cn/post/7344571968174735412
评论
请登录