周一的技术战略会上,贾瀞雯在白板上写下四个字:图像搜索。
会议室里安静了几秒。
然后响起一阵低低的议论声。
“图像搜索?”李明重复了一遍,“用户上传图片,然后我们找相似的图片?”
“对。”贾瀞雯点头,“技术上叫基于内容的图像检索。
国外有实验室在研究,但还没有成熟的产品。”
张涛推了推眼镜:“贾总,这个……太超前了吧?我们现在连文字搜索都还没做到完美。
图像搜索的复杂度要高几个数量级。”
“我知道难。”贾瀞雯说,“但搜索的未来不只是文字。
图片、声音、视频,这些都是信息。
如果我们现在不开始研究,等别人做出来了,我们就落后了。”
王磊举手:“技术上具体要做什么?”
“分几个部分。”贾瀞雯在白板上画图,“第一,特征提取。
从图片里提取颜色、纹理、形状等特征。
第二,特征索引。
把这些特征建成可搜索的数据库。
第三,相似度匹配。
用户上传图片后,计算和库中图片的相似度,返回最接近的结果。”
她画完,看向团队。
大多数人都皱着眉头。
“这需要计算机视觉的专业知识。”新来的一个算法工程师说,“我们团队没人懂这个领域。”
“需要大量的计算资源。”另一个工程师补充,“图片特征提取很耗CPU,匹配算法也很复杂。
现在的服务器可能扛不住。”
“还有数据问题。”李明说,“我们需要海量的图片数据来训练和测试。
去哪找这么多图片?”
质疑声一个接一个。
贾瀞雯安静地听着,等大家都说完了,她才开口。
“所有的困难我都知道。”她说,“但陈总说了,有些事现在不做,以后就晚了。
图像搜索是未来,我们必须现在开始布局。”
她顿了顿:“当然,不是要马上做出产品。
我们先做预研,探索技术可行性。
周期定六个月,投入资源控制在可接受范围内。
这样可以吗?”
团队互相看了看,最终都点了头。
但贾瀞雯能看出来,大部分人心里还是没底。
会后,她给陈浩打电话汇报情况。
“团队反应怎么样?”陈浩问。
“有疑虑。”贾瀞雯实话实说,“觉得太超前,技术难度太大。”
“正常。”陈浩说,“新技术的探索总是这样。
我等会儿发你一些资料,是国外论文和研究报告。
你让团队先学习,有个概念。”
半小时后,邮箱里多了十几封邮件。
附件全是PDF,英文的,有些还有复杂的数学公式。
贾瀞雯打印出来,厚厚一摞。
她抱着这摞资料回到会议室,团队还在讨论。
“这是陈总发的资料。”她把资料放在桌上,“大家先看看,了解下这个领域的前沿进展。”
李明拿起一份,翻了翻,眼睛渐渐亮起来。
“这篇论文……讲的是基于颜色直方图的图像匹配。
思路挺巧妙的。”
张涛也拿起一份:“这个是纹理特征提取的方法,用到了小波变换。”
新来的算法工程师看着一篇论文,喃喃自语:“这个相似度度量公式……有点意思。”
资料起了作用。
团