见解和分析

见解和分析为 Docker Hub 上的 Docker Verified Publisher (DVP) 和 Docker 赞助的开源 (DSOS) 映像提供使用情况分析。这包括在所需时间范围内自助访问图像和扩展程序使用指标。您还可以按标签或摘要显示图像拉取数量,并按地理位置、云提供商、客户端等获取细分。

提示

前往 Docker 验证发布者计划Docker 赞助的开源页面,了解有关这些计划的更多信息。

查看图像的分析数据

您可以在Insights 和分析仪表板上找到存储库的分析数据,网址为: https://hub.docker.com/orgs/{namespace}/insights/images。仪表板包含使用数据的可视化和一个表格,您可以在其中将数据下载为 CSV 文件。

要查看图表中的数据:

  • 选择数据粒度:每周或每月
  • 选择时间间隔:3、6 或 12 个月
  • 在列表中选择一个或多个存储库
见解和分析图表可视化

提示

将光标悬停在图表上会显示工具提示,显示时间点的精确数据。

共享分析数据

您可以使用图表上方的共享图标与其他人共享可视化效果。这是与组织中的其他人共享统计数据的便捷方式。

图表共享图标

选择该图标会生成一个链接,该链接将复制到您的剪贴板。该链接会保留您所做的显示选择。当有人点击该链接时, “见解和分析”页面将打开并显示图表,其配置与您在创建链接时设置的配置相同。

扩展分析数据

如果您已在扩展市场中发布了 Docker 扩展,您还可以获得有关扩展使用情况的分析(以 CSV 文件形式提供)。您可以从见解和分析仪表板下载扩展 CSV 报告,网址为: https://hub.docker.com/orgs/{namespace}/insights/extensions。如果您的 Docker 命名空间包含市场上已知的扩展,您将看到一个“扩展”选项卡,其中列出了您的扩展的 CSV 文件。

导出分析数据

您可以从 Web 仪表板或使用 DVP 数据 API导出分析数据。组织的所有成员都可以访问分析数据。

该数据以可下载的 CSV 文件形式提供,格式为每周(周一至周日)或每月。每月数据从下一个日历月的第一天开始提供。您可以将此数据导入到您自己的系统中,也可以将其作为电子表格手动分析。

导出数据

按照以下步骤使用 Docker Hub 网站导出组织映像的使用数据:

  1. 登录 Docker Hub并选择Organizations

  2. 选择您的组织并选择见解和分析

    组织概览页面,带有“见解和分析”选项卡
  3. 设置要导出分析数据的时间跨度。

    摘要和原始数据的可下载 CSV 文件显示在右侧。

    分析数据的过滤选项和下载链接

使用API​​导出数据

HTTP API 端点位于: https://hub.docker.com/api/publisher/analytics/v1。了解如何使用DVP 数据 API 文档中的 API 导出数据 。

数据点

以原始或摘要格式导出数据。每种格式包含不同的数据点和不同的结构。

以下部分描述了每种格式的可用数据点。添加日期列 显示首次引入该字段的时间。

图像拉取原始数据

原始数据格式包含以下数据点。 CSV 文件中的每一行代表一个图像拉取。

数据点描述添加日期
行动请求类型,参见 Action分类规则。其中之一pull_by_tag,,pull_by_digestversion_check2022 年 1 月 1 日
行动日时间戳的日期部分:YYYY-MM-DD2022 年 1 月 1 日
国家请求原籍国。2022 年 1 月 1 日
消化图像摘要。2022 年 1 月 1 日
HTTP方式请求中使用的HTTP方法, 详细信息请参见注册表API文档。2022 年 1 月 1 日
主持人事件中使用的云服务提供商。2022 年 1 月 1 日
命名空间Docker 组织(镜像命名空间)。2022 年 1 月 1 日
参考请求中使用的图像摘要或标签。2022 年 1 月 1 日
存储库Docker 存储库(镜像名称)。2022 年 1 月 1 日
标签(如有)仅当请求引用标签时才可用的标签名称。2022 年 1 月 1 日
时间戳请求的日期和时间:YYYY-MM-DD 00:00:002022 年 1 月 1 日
类型事件起源的行业。business、、、、之一。isphosting​​educationnull2022 年 1 月 1 日
用户代理工具用户用于拉取图像的应用程序(例如,dockercontainerd)。2022 年 1 月 1 日
用户代理版本用于拉取映像的应用程序的版本。2022 年 1 月 1 日
领域请求原始域名,请参阅 隐私2022 年 10 月 11 日
所有者拥有存储库的组织的名称。2022 年 12 月 19 日

图像提取摘要数据

有两个级别的汇总数据可用:

  • 存储库级别,每个命名空间和存储库的摘要
  • 标签或摘要级别,每个命名空间、存储库和引用(标签或摘要)的摘要

摘要数据格式包含所选时间跨度的以下数据点:

数据点描述添加日期
唯一的IP地址唯一 IP 地址的数量,请参阅 隐私2022 年 1 月 1 日
按标签拉取GET 请求,按摘要或按标签。2022 年 1 月 1 日
按摘要拉取按摘要的 GET 或 HEAD 请求,或按摘要的 HEAD。2022 年 1 月 1 日
版本检查HEAD 为标签,后面不跟 GET2022 年 1 月 1 日
所有者拥有存储库的组织的名称。2022 年 12 月 19 日

图片拉动作分类规则

一个操作代表与一个 关联的多个请求事件 docker pull。拉取按类别分组,使数据对于理解用户行为和意图更有意义。类别有:

  • 版本检查
  • 按标签拉取
  • 按摘要拉取

自动化系统经常检查图像的新版本。能够区分 CI 中的“版本检查”与用户拉取的实际映像,可以让您更深入地了解用户的行为。

下表描述了用于确定拉动背后意图的规则。要提供反馈或询问有关这些规则的问题, 请填写 Google 表单

开始活动参考其次是结果行动用例)笔记
标签不适用版本检查用户已经拥有本地计算机上存在的所有层这类似于当用户已经拥有本地存在的所有图像层时按标签拉取的用例,但是,它区分了用户意图并相应地进行分类。
得到标签不适用按标签拉取用户已拥有本地计算机上存在的所有层和/或映像是单架构的
得到标签通过不同的摘要获取按标签拉取图像是多架构的第二个摘要 GET 必须与第一个不同。
标签通过相同的摘要获取按标签拉取映像是多架构的,但部分或全部映像层已存在于本地计算机上HEAD by tag 发送最新的摘要,后续的 GET 必须是相同的摘要。如果映像是多架构的,则可能会发生额外的 GET(请参阅此表中的下一行)。如果用户不想要最新的摘要,则用户按摘要执行 HEAD。
标签通过相同的摘要获取,然后通过不同的摘要进行第二次 GET按标签拉取图像是多架构的HEAD by tag 发送最新的摘要,后续的 GET 必须是相同的摘要。由于图像是多架构的,因此存在不同摘要的第二个 GET。如果用户不想要最新的摘要,则用户按摘要执行 HEAD。
标签通过相同的摘要获取,然后通过不同的摘要进行第二次 GET按标签拉取图像是多架构的HEAD by tag 发送最新的摘要,后续的 GET 必须是相同的摘要。由于图像是多架构的,因此存在不同摘要的第二个 GET。如果用户不想要最新的摘要,则用户按摘要执行 HEAD。
得到消化不适用按摘要拉取用户已拥有本地计算机上存在的所有层和/或映像是单架构的
消化不适用按摘要拉取用户的本地计算机上已存在所有层
得到消化通过不同的摘要获取按摘要拉取图像是多架构的第二个摘要 GET 必须与第一个不同。
消化通过相同的摘要获取按摘要拉取映像是单架构和/或映像是多架构,但映像的某些部分已存在于本地计算机上
消化通过相同的摘要获取,然后通过不同的摘要进行第二次 GET按摘要拉动图像是多架构的

扩展摘要数据

有两个级别的扩展摘要数据可用:

  • 核心摘要,包含基本扩展使用信息:扩展安装次数、卸载次数以及所有时间的总安装次数

core-summary-data 文件包含所选时间跨度的以下数据点:

数据点描述添加日期
安装量扩展程序的安装数量2024 年 2 月 1 日
总安装量扩展程序始终的安装次数2024 年 2 月 1 日
卸载扩展程序的卸载次数2024 年 2 月 1 日
总卸载量始终卸载扩展程序的次数2024 年 2 月 1 日
更新扩展的更新数量2024 年 2 月 1 日
  • 高级摘要,包含高级扩展使用信息:唯一用户安装、卸载、唯一用户打开扩展。

core-summary-data 文件包含所选时间跨度的以下数据点:

数据点描述添加日期
安装量扩展程序的安装数量2024 年 2 月 1 日
独特安装量安装扩展程序的唯一用户数量2024 年 2 月 1 日
卸载扩展程序的卸载次数2024 年 2 月 1 日
独特卸载量卸载扩展程序的唯一用户数2024 年 2 月 1 日
用法扩展卡舌的开口数2024 年 2 月 1 日
唯一用户数打开扩展选项卡的唯一用户数量2024 年 2 月 1 日

数据随时间的变化

洞察和分析服务不断改进,以增加为出版商带来的价值。一些更改可能包括添加新的数据点,或改进现有数据以使其更有用。

数据集中的更改(例如添加或删除字段)通常仅适用于该字段首次引入之日起及以后。

请参阅数据点部分中的表格 ,了解给定数据点的可用日期。

隐私

本节包含有关隐私保护措施的信息,这些措施可确保 Docker Hub 上内容的消费者保持完全匿名。

重要的

Docker 绝不会共享任何个人身份信息 (PII) 作为分析数据的一部分。

图像提取摘要数据集,包括唯一的 IP 地址计数。该数据点仅包括请求图像的不同唯一 IP 地址的数量。个人 IP 地址永远不会共享。

该图像提取原始数据集,包括用户 IP 域作为数据点。这是与用于拉取映像的 IP 地址关联的域名。如果 IP 类型为 business,则域代表与该 IP 地址关联的公司或组织(例如docker.com)。对于任何其他不属于 的 IP 类型 business,域代表用于发出请求的互联网服务提供商或托管提供商。平均而言,所有拉取中只有约 30% 属于businessIP 类型(这因发布商和镜像而异)。