斯坦福大学的筹划生们缔造了一款名为 PIGEON 的应用门径,不错只是通过巡逻 Google 街景图像或其他图像来细目具体位置神秘顾客技术,其准确率令东说念主印象长远。
字据预印本论文的数据,PIGEON 不错以92%的准确率展望所拍摄国度,而况在40%的估计中不错将位置定位在诡计位置的25公里范围内。该论文指出,PIGEON 在 GeoGuessr 游戏中名次前0.01%的玩家之内,该游戏条款用户字据所拍摄的 Google 街景图像估计位置,这亦然这个边幅的灵感开始。
那么,PIGEON 是何如责任的呢?
学生们运用了 OpenAI 缔造的神经集会 CLIP,通过对视觉类又名呼进行锻练,使其大致将文本和图像进行贯穿。然后,他们字据 GeoGuessr 的数据集进行了锻练,该数据集包含了10万个原始随即采样的场地和四张图像,以袒护给定位置的统统这个词 “全景”,悉数有40万张图像。与其他 AI 模子锻练的图像数目比较,PIGEON 的锻练图像数目相对较少。举例,OpenAI 流行的图像生成模子 DALL-E2是基于数亿张图像进行锻练的。
神秘顾客公司_赛优市场调研此外,神秘顾客介绍学生们还研发了一个名为 PIGEOTTO 的单独模子,该模子通过锻练来自 Flickr 和维基百科的400万张像片,以从单张图像中识别位置。字据论文的数据,PIGEOTTO 在图像地舆定位基准测试中赢得了令东说念主印象长远的收获,在城市准确度方面跨越先前的最新技能效力7.7%,在国度准确度方面跨越29.8%。
论文还探讨了与该模子干系的伦理酌量,包括其益处和风险。在一方面,图像地舆定位具有好多积极的用途,举例自动驾驶、视觉走访以及慷慨对像片拍摄场地的意思心。但是,其负面影响包括对诡秘的最径直侵略。因此,学生们决定不公缔造布模子权重,仅在学术考据时发布代码。
这项筹划为咱们展示了 AI 在图像地舆定位方面的浩大后劲神秘顾客技术,但也激发了诡秘和伦理方面的一些担忧。在改日的发展中,必须愈加喜欢这些问题,并确保允洽的保护模范得以现实。