近期,包校十一年级学生Joey收到了一份由丘成桐中学科学奖发来的喜讯,
他撰写的《基于单目视觉的网球出界判断方法研究》荣获了2020年
丘成桐中学科学奖全球总决赛计算机组的铜奖。
充满内驱力的科技少年
回顾这次获奖经历,Joey坦言与他在包校的成长密不可分。在八年级刚进入包校时,Joey经常不习惯也不情愿站在大家面前讲话,但为了完成老师布置的各种演讲和展示作业,他不得不逼着自己进行演讲训练。几年之后,现在的他已经能够从容地在大赛中进行专业的中英文演讲和答辩,这次丘成桐中学科学奖Joey就经历了两次重要的答辩,包括在浙江大学的半决赛中文答辩,以及后面在清华大学的总决赛英文答辩。对于Joey而言,在包校提高的不仅是表达能力,他的思维也愈发活跃。“如果没有来到包校,我可能也会有不错的学术成绩,也能进入一所不错的大学,但是个人综合能力的发展则会受到一定限制,而接触新事物的机会也不会像现在这么多。”Joey这样说。
Joey认为自己在包校一路走来最大的收获便是有了内驱力。曾今的他需要在老师和父母的一再敦促下才会不情愿地开始学习,而现在的他意识到学习是自己的事,因而自主性变得更强。Joey介绍道:“包校特别的地方在于老师不会时刻跟在你后面催着你写作业,但是会给你设置一个严格的作业截止日期。这样做的的好处在于极大地提升了学生的时间管理能力——你不仅成为了时间的主人,也成为了作业的主人。”
Joey在七年级时开始接触计算机编程,到了包校后选择了IGCSE计算机学科,并在IB阶段选择了计算机高级水平课程。IB计算机科学课包括编程及运用计算机解决实际生活中的问题等内容,旨在培养学生的计算机思维,并让学生对计算机和其它数码设备的运行及编程有了一定的了解。据Joey介绍,在此次丘成桐奖提交的研究课题中,他就运用了IB课程中所学到的计算机思维——将一个大问题分解成数个小问题,然后逐个击破。"
体育和计算机科学碰撞产生的火花
作为一个热爱各类体育项目的体育迷,Joey尤其热衷于网球。他从7年级始正式接受专业的网球训练,目前是国家二级网球运动员,参加了许多大大小小的网球比赛。细心的Joey在市级赛和业余赛中发现,由于此类比赛在判罚时通常采用信任制,也就是让对手来界定球是否出界,因此当遇到球速过快时,具有争议的判罚时常发生。现阶段解决这一问题只能通过专业的即时回放评判系统——鹰眼系统,然而此套系统价格极其昂贵,目前只能应用在国家级甚至更高水平的专业比赛中。为了解决这一问题,Joey在去年3月萌生了自制一套简单且成本低廉的鹰眼系统,来代替传统鹰眼系统的想法。
据Joey介绍,职业比赛中使用的传统鹰眼主要运用了双目视觉技术,即通过一台拥有两个摄像头的摄像机,模拟人眼的方式来得到球的三维坐标,为此还需要对场地进行三维重构。起初,Joey也想使用双目视觉技术,但由于此技术较为复杂,而双摄像头的摄像机价格也十分昂贵,有悖于缩减成本的设计初衷。因此,在上海交通大学严骏驰教授的指导下,他决定采用单目视觉技术,如此一来不仅可以直接在二维平面上完成球体识别与判断,还可以大大缩减成本。
确定使用单目视觉技术之后,便进入了实验测试阶段,在此过程中 Joey遇到了一些难题,其中第一个挑战就是如何让计算机通过拍摄的视频来准确定位网球:首先,处于动态中的网球目标小、运动速度快,容易导致漏检;其次,视频中存在着其它干扰导致误检,如奔跑中的球员,隔壁球场的网球等。为了提高计算机识别网球运行轨迹的准确度,进而找到需要判罚的球,Joey对市面上现有检测物体运动轨迹的方法进行了筛选,最终选出了两种基础的运动物体检测定位方法,再将两种相结合,从而找到视频中网球运动轨迹,从而更精准地定位需要判罚的球。
Joey遇到的第二个挑战是对网球弹跳点的预测。因为网球的弹跳是球运动轨迹的一种突变,部分在弹跳点前后的球点,由于网球速度、旋转、拍摄角度的变化,球的弹跳轨迹突变不明显,这样导致的结果是很难区分这些球点是在网球的下降期还是上升期,所以很容易造成预测误差。针对这一难点,Joey将在网球落地点前后的球点归类为不确定性点,然后将这些不确定性点依次加入下降期或上升期的运动轨迹上,得到多种组合,通过最小二乘法拟合曲线,然后找到误差最小的一种组合,这种组合所得到的弹跳点即预测的弹跳点。经过这一处理,预测点的误差减少了许多。最后Joey再根据弹跳点坐标和网球场地线坐标的相对位置关系来判断网球是否否出界。
为了验证自己的方法,Joey在导师和团队的帮助下历经数月收集并标注了数百段视频样本,实现了核心模块算法,包括网球轨迹定位、弹跳点预测等。实验表明,他的方法在自动判断是否出界准确率达到99.5%,靠近出界临界点易混淆的样本准确率达到 81.8%,初步验证了其可行性。据Joey介绍,这款单目视觉鹰眼系统与传统的鹰眼系统相比成本降低了98%,但与此同时判罚的准确率从信任制的大约70%左右提高到了95%,且判罚速度只需要2-3秒。Joey在去年5月开始着手这个项目,经历了阅读文献、实验阶段、撰写研究报告和修改报告、半决赛答辩、总决赛答辩几个阶段。
宝剑锋从磨砺出,梅花香自苦寒来。Joey 10多年来坚持各项体育运动以及在网球方向
的专业训练,付出很多也收获很多。他跟指导老师一起将网球比赛中碰到的
问题提炼出来,与科技结合在一起,为促进网球运动贡献一点点力量。我们感到很欣慰,
这是包校提倡的全人教育的结果,也是我们父母共同追求的目标。期望Joey在未来的
道路上,始终保持开放思维,终身成长。未来将更好的成果回馈社会。
———— Joey妈妈
拟合
形象来说,就是把平面上一系列的点,用一条光滑的曲线连接起来。因为这条曲线有无数种可能,从而有各种拟合方法,目标是得到一条与图像上点最符合的曲线。
最小二乘法
一种数学优化技术。通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小,从而给出在统计意义上最好的参数拟合结果。
鹰眼系统
鹰眼系统是一种即时回放系统。通过高速高质量的摄像机和计算机视觉技术跟踪并记录球体的轨迹,并将其预测上最可能的球体运动路径及弹跳点以动态图像的形式虚拟重放,清晰地展现给观众和球员。鹰眼系统可从多角度展现比赛,克服人眼判断的诸多盲区,提高裁判判决的准确性,以及比赛的公平性;此外,鹰眼系统可分析击球数据与球手技能的优势劣势,提供球类运动教学参考。鹰眼系统不仅仅在网球,足球、板球、网球、篮球、羽毛球、橄榄球、棒球、排球、台球等体育项目中也有广泛的应用。
——内容摘抄自Joey的
《基于单目视觉的网球出界判断方法研究》
丘成桐中学科学奖
丘成桐中学科学奖于2008年由国际知名数学家丘成桐先生发起设立,目前包括数学、物理、化学、生物、计算机及经济金融建模六个学科方向。2020年的丘成桐中学科学奖于当年4月启动,历时8个月,共有来自国内近30个省市及英国、美国、新加坡等17个国家和地区的1170支队伍,涉及300余所中学报名参赛,累计提交有效论文共计901篇。