见解和分析
见解和分析为 Docker Hub 上的 Docker Verified Publisher (DVP) 和 Docker 赞助的开源 (DSOS) 映像提供使用情况分析。这包括在所需时间范围内自助访问图像和扩展程序使用指标。您还可以按标签或摘要显示图像拉取数量,并按地理位置、云提供商、客户端等获取细分。
提示
前往 Docker 验证发布者计划或 Docker 赞助的开源页面,了解有关这些计划的更多信息。
查看图像的分析数据
您可以在Insights 和分析仪表板上找到存储库的分析数据,网址为:
https://hub.docker.com/orgs/{namespace}/insights/images
。仪表板包含使用数据的可视化和一个表格,您可以在其中将数据下载为 CSV 文件。
要查看图表中的数据:
- 选择数据粒度:每周或每月
- 选择时间间隔:3、6 或 12 个月
- 在列表中选择一个或多个存储库


提示
将光标悬停在图表上会显示工具提示,显示时间点的精确数据。
共享分析数据
您可以使用图表上方的共享图标与其他人共享可视化效果。这是与组织中的其他人共享统计数据的便捷方式。


选择该图标会生成一个链接,该链接将复制到您的剪贴板。该链接会保留您所做的显示选择。当有人点击该链接时, “见解和分析”页面将打开并显示图表,其配置与您在创建链接时设置的配置相同。
扩展分析数据
如果您已在扩展市场中发布了 Docker 扩展,您还可以获得有关扩展使用情况的分析(以 CSV 文件形式提供)。您可以从见解和分析仪表板下载扩展 CSV 报告,网址为:
https://hub.docker.com/orgs/{namespace}/insights/extensions
。如果您的 Docker 命名空间包含市场上已知的扩展,您将看到一个“扩展”选项卡,其中列出了您的扩展的 CSV 文件。
导出分析数据
您可以从 Web 仪表板或使用 DVP 数据 API导出分析数据。组织的所有成员都可以访问分析数据。
该数据以可下载的 CSV 文件形式提供,格式为每周(周一至周日)或每月。每月数据从下一个日历月的第一天开始提供。您可以将此数据导入到您自己的系统中,也可以将其作为电子表格手动分析。
导出数据
按照以下步骤使用 Docker Hub 网站导出组织映像的使用数据:
登录 Docker Hub并选择Organizations。
选择您的组织并选择见解和分析。
设置要导出分析数据的时间跨度。
摘要和原始数据的可下载 CSV 文件显示在右侧。
使用API导出数据
HTTP API 端点位于:
https://hub.docker.com/api/publisher/analytics/v1
。了解如何使用DVP 数据 API 文档中的 API 导出数据
。
数据点
以原始或摘要格式导出数据。每种格式包含不同的数据点和不同的结构。
以下部分描述了每种格式的可用数据点。添加日期列 显示首次引入该字段的时间。
图像拉取原始数据
原始数据格式包含以下数据点。 CSV 文件中的每一行代表一个图像拉取。
数据点 | 描述 | 添加日期 |
---|---|---|
行动 | 请求类型,参见
Action分类规则。其中之一pull_by_tag ,,pull_by_digest 。version_check | 2022 年 1 月 1 日 |
行动日 | 时间戳的日期部分:YYYY-MM-DD 。 | 2022 年 1 月 1 日 |
国家 | 请求原籍国。 | 2022 年 1 月 1 日 |
消化 | 图像摘要。 | 2022 年 1 月 1 日 |
HTTP方式 | 请求中使用的HTTP方法, 详细信息请参见注册表API文档。 | 2022 年 1 月 1 日 |
主持人 | 事件中使用的云服务提供商。 | 2022 年 1 月 1 日 |
命名空间 | Docker 组织(镜像命名空间)。 | 2022 年 1 月 1 日 |
参考 | 请求中使用的图像摘要或标签。 | 2022 年 1 月 1 日 |
存储库 | Docker 存储库(镜像名称)。 | 2022 年 1 月 1 日 |
标签(如有) | 仅当请求引用标签时才可用的标签名称。 | 2022 年 1 月 1 日 |
时间戳 | 请求的日期和时间:YYYY-MM-DD 00:00:00 。 | 2022 年 1 月 1 日 |
类型 | 事件起源的行业。business 、、、、之一。isp hosting education null | 2022 年 1 月 1 日 |
用户代理工具 | 用户用于拉取图像的应用程序(例如,docker 或containerd )。 | 2022 年 1 月 1 日 |
用户代理版本 | 用于拉取映像的应用程序的版本。 | 2022 年 1 月 1 日 |
领域 | 请求原始域名,请参阅 隐私。 | 2022 年 10 月 11 日 |
所有者 | 拥有存储库的组织的名称。 | 2022 年 12 月 19 日 |
图像提取摘要数据
有两个级别的汇总数据可用:
- 存储库级别,每个命名空间和存储库的摘要
- 标签或摘要级别,每个命名空间、存储库和引用(标签或摘要)的摘要
摘要数据格式包含所选时间跨度的以下数据点:
数据点 | 描述 | 添加日期 |
---|---|---|
唯一的IP地址 | 唯一 IP 地址的数量,请参阅 隐私。 | 2022 年 1 月 1 日 |
按标签拉取 | GET 请求,按摘要或按标签。 | 2022 年 1 月 1 日 |
按摘要拉取 | 按摘要的 GET 或 HEAD 请求,或按摘要的 HEAD。 | 2022 年 1 月 1 日 |
版本检查 | HEAD 为标签,后面不跟 GET | 2022 年 1 月 1 日 |
所有者 | 拥有存储库的组织的名称。 | 2022 年 12 月 19 日 |
图片拉动作分类规则
一个操作代表与一个 关联的多个请求事件
docker pull
。拉取按类别分组,使数据对于理解用户行为和意图更有意义。类别有:
- 版本检查
- 按标签拉取
- 按摘要拉取
自动化系统经常检查图像的新版本。能够区分 CI 中的“版本检查”与用户拉取的实际映像,可以让您更深入地了解用户的行为。
下表描述了用于确定拉动背后意图的规则。要提供反馈或询问有关这些规则的问题, 请填写 Google 表单。
开始活动 | 参考 | 其次是 | 结果行动 | 用例) | 笔记 |
---|---|---|---|---|---|
头 | 标签 | 不适用 | 版本检查 | 用户已经拥有本地计算机上存在的所有层 | 这类似于当用户已经拥有本地存在的所有图像层时按标签拉取的用例,但是,它区分了用户意图并相应地进行分类。 |
得到 | 标签 | 不适用 | 按标签拉取 | 用户已拥有本地计算机上存在的所有层和/或映像是单架构的 | |
得到 | 标签 | 通过不同的摘要获取 | 按标签拉取 | 图像是多架构的 | 第二个摘要 GET 必须与第一个不同。 |
头 | 标签 | 通过相同的摘要获取 | 按标签拉取 | 映像是多架构的,但部分或全部映像层已存在于本地计算机上 | HEAD by tag 发送最新的摘要,后续的 GET 必须是相同的摘要。如果映像是多架构的,则可能会发生额外的 GET(请参阅此表中的下一行)。如果用户不想要最新的摘要,则用户按摘要执行 HEAD。 |
头 | 标签 | 通过相同的摘要获取,然后通过不同的摘要进行第二次 GET | 按标签拉取 | 图像是多架构的 | HEAD by tag 发送最新的摘要,后续的 GET 必须是相同的摘要。由于图像是多架构的,因此存在不同摘要的第二个 GET。如果用户不想要最新的摘要,则用户按摘要执行 HEAD。 |
头 | 标签 | 通过相同的摘要获取,然后通过不同的摘要进行第二次 GET | 按标签拉取 | 图像是多架构的 | HEAD by tag 发送最新的摘要,后续的 GET 必须是相同的摘要。由于图像是多架构的,因此存在不同摘要的第二个 GET。如果用户不想要最新的摘要,则用户按摘要执行 HEAD。 |
得到 | 消化 | 不适用 | 按摘要拉取 | 用户已拥有本地计算机上存在的所有层和/或映像是单架构的 | |
头 | 消化 | 不适用 | 按摘要拉取 | 用户的本地计算机上已存在所有层 | |
得到 | 消化 | 通过不同的摘要获取 | 按摘要拉取 | 图像是多架构的 | 第二个摘要 GET 必须与第一个不同。 |
头 | 消化 | 通过相同的摘要获取 | 按摘要拉取 | 映像是单架构和/或映像是多架构,但映像的某些部分已存在于本地计算机上 | |
头 | 消化 | 通过相同的摘要获取,然后通过不同的摘要进行第二次 GET | 按摘要拉动 | 图像是多架构的 |
扩展摘要数据
有两个级别的扩展摘要数据可用:
- 核心摘要,包含基本扩展使用信息:扩展安装次数、卸载次数以及所有时间的总安装次数
core-summary-data 文件包含所选时间跨度的以下数据点:
数据点 | 描述 | 添加日期 |
---|---|---|
安装量 | 扩展程序的安装数量 | 2024 年 2 月 1 日 |
总安装量 | 扩展程序始终的安装次数 | 2024 年 2 月 1 日 |
卸载 | 扩展程序的卸载次数 | 2024 年 2 月 1 日 |
总卸载量 | 始终卸载扩展程序的次数 | 2024 年 2 月 1 日 |
更新 | 扩展的更新数量 | 2024 年 2 月 1 日 |
- 高级摘要,包含高级扩展使用信息:唯一用户安装、卸载、唯一用户打开扩展。
core-summary-data 文件包含所选时间跨度的以下数据点:
数据点 | 描述 | 添加日期 |
---|---|---|
安装量 | 扩展程序的安装数量 | 2024 年 2 月 1 日 |
独特安装量 | 安装扩展程序的唯一用户数量 | 2024 年 2 月 1 日 |
卸载 | 扩展程序的卸载次数 | 2024 年 2 月 1 日 |
独特卸载量 | 卸载扩展程序的唯一用户数 | 2024 年 2 月 1 日 |
用法 | 扩展卡舌的开口数 | 2024 年 2 月 1 日 |
唯一用户数 | 打开扩展选项卡的唯一用户数量 | 2024 年 2 月 1 日 |
数据随时间的变化
洞察和分析服务不断改进,以增加为出版商带来的价值。一些更改可能包括添加新的数据点,或改进现有数据以使其更有用。
数据集中的更改(例如添加或删除字段)通常仅适用于该字段首次引入之日起及以后。
请参阅数据点部分中的表格 ,了解给定数据点的可用日期。
隐私
本节包含有关隐私保护措施的信息,这些措施可确保 Docker Hub 上内容的消费者保持完全匿名。
重要的
Docker 绝不会共享任何个人身份信息 (PII) 作为分析数据的一部分。
图像提取摘要数据集,包括唯一的 IP 地址计数。该数据点仅包括请求图像的不同唯一 IP 地址的数量。个人 IP 地址永远不会共享。
该图像提取原始数据集,包括用户 IP 域作为数据点。这是与用于拉取映像的 IP 地址关联的域名。如果 IP 类型为
business
,则域代表与该 IP 地址关联的公司或组织(例如docker.com
)。对于任何其他不属于 的 IP 类型
business
,域代表用于发出请求的互联网服务提供商或托管提供商。平均而言,所有拉取中只有约 30% 属于business
IP 类型(这因发布商和镜像而异)。