《移动互联网创新应用》研习班(一)

上周五到周日参加了计算机协会举办的《移动互联网创新应用》研习班。研习班请来了来自微软、浙大、清华、北大的一些学者以及来自腾讯、百度、小米的数名经理讲了学术界与产业界进行的一些研究和探索。听这样的讲习班,最大的益处在于开阔视野,特别是在移动互联网这个热门而前沿的领域里,学术界、产业界都在做一些很棒的事情。技术的革新和发展是IT产业的源动力,我今后的职业意愿是产品经理,希望有机会将最顶尖的技术转化为产品,给用户带去新的体验。因此,我就从产品应用的角度,对这个研习班做一下回顾。


《数字生活中的移动计算》 芮勇 微软亚太研发集团的高级总监

 

芮勇的这篇报告是综述性的,介绍了在数字时代人们的生活发生的一些变化。

看几个有趣的时间节点:

Ø 2012年,历史长达244年的大英百科全书(Encyclopedia Britannica)不再付印;

Ø 2010年,在报纸出现305年之后,Internet的广告收入超过了报纸;

Ø 2002年,在电话出现125年之后,移动设备的数量超越了有线电话的数量。

这样一些时间点告诉我们,数字时代已经到来,而“移动计算”将是其中最为重要的一个环节。如今,智能手机、平板已经基本取代了PC、有线电话和随身听。而令人惊讶的是,手机的概念仅仅出现在30年以前。在这短短的30年里,手机的方方面面,无论是信号质量、应用数量、使用人群的数量都获得了飞跃。

在数字时代,图片是非常重要的信息载体,微软在这方面有很多的研究成果。介绍一个与移动设备结合起来的实例。人们在外旅行的时候,看到一座建筑,却不知道名字,只需要拿起手机拍摄、上传,便可以获取到该建筑相关的所有信息。这个技术已经被成功的转化成了一个Window Phone应用:Nokia City Lens。有了它,妈妈再也不用担心我的旅行!这是如何做到的呢?

在图像处理的领域,有一个核心问题,便是语义的是识别:Image -> Word。刚才这个例子中所遇到的问题,可以描述为:如何将成千上万张的图片与一个百万量级的Entity Graph对应起来,换句话说,就是如何将大量的图片根据语义有序的组织起来。其中遇到最大的挑战在于:1这么大的数据量,如何才能高效处理;2如何去除其中的噪音。具体的解决方案就不多说了。

接着展示了另外两个新鲜的demo。一个demo演示的是实时翻译系统,非常实用的应用。另外一个名叫OmniTouch,在肩上安装相应的设备之后,可以使投射到的区域都变成可触摸交互的区域。

最后,芮勇又展望了一些移动互联网的流行趋势:

ü 3G/LTE/GPS/NFC/IPV6…

ü 智能手机= Hardware + OS +APPs

ü Mobile OS:三国演义

ü NUI + Location + Sensors + AR–> blending physical world

ü Data mining + BI-> power of cloud

ü Social, commerce, twitter,wallet…

 

最后的最后,芮勇还特别提到了腾讯公司的创新商业模式,以及中国用户在浏览页面时,令人惊讶的探索精神(我想,这是被国内网站无比糟糕的界面设计给练出来的吧)。

 

《移动社交网络与用户位置》 谢幸 微软亚洲研究院主管研究员

谢幸讲的这个课题很有趣,是关于移动社交网络和用户位置的,时下流行的Foursquare、街旁便是这方面的应用。

获取位置信息,依靠的是定位技术,常见的定位技术有GPSRFID、蓝牙、Cell-ID等。今年五月份Google Map推出的室内导航功能则利用了室内定位技术。

如今85%的移动设备都搭载了GPS,获取用户的位置数据的渠道越来越多:带地理标注的照片、微博、游记,位置搜索日志、地图服务日志等。从大的方面来看,如何用一个很好的机制集中管理这些来自不同设备、不同服务和不同用户的位置数据是需要研究的课题。

在移动社交网络中,有一类基于位置的社交网络:Location Based Social Networks,称为签到服务。知名的应用Foursquare便提供这种服务。接着,详细介绍三个相关的研究课题。

第一项研究,名为:QueryCo-Location Pattern Discovery。这项研究的主要目的是吗,根据位置信息,为queryquery建立起关联,找到一定的pattern。他们选取了2007年某两个星期的谷歌搜索数据,大约有100万,从其中抽取出了一些pattern。这样的pattern分为globallocal两类,显然,Local pattern会比较多。比如说,”hotel” “MGMGrand”就是一个Local pattern

可以想象,这样一些pattern在改进基于位置的搜索、提供个性化服务可以方面有非常显著的作用。


第二项研究,名为:GeoLife:Building Social Networks Using Human LocationHistory。这项研究的目的是根据用户的位置信息,挖掘出一些社交方面的信息。他们选取了178名用户,采集了他们在2007-2011四年之间的所有和位置相关的活动记录。这项研究可以从两个方向来看:

首先,通过一个人的足迹信息,是不是可以挖掘出一个人的个性呢?基于这样的个性信息,我们便可以进行好友推荐、个性化服务了。

第二,如果我们不只按照一个人的足迹建模,而是按照“用户-地点-活动”的三维方式建模,那么还可以获得更多关于活动和地理位置的信息。于是,便可以进行活动和基于位置的推荐:该去哪家店吃饭?可以去参加什么活动?


第三项研究,是关于如何从GPS信息映射到地点名称。这一技术在Foursquare、街旁里面已经被用到。基本问题可以描述为,有一些check-in的数据、用户信息、时间信息、GPS信息、地点集合,如何从地点集合里找出一个最好的子集返回给用户,并进行排序。

 

最后,谢幸还讲到了学术界非常热门的研究课题:Human Mobility,从用户的各种位置信息中挖掘出更多个性化信息、社交信息。特别是一项名为Human Mobility Prediction的研究,非常有趣。它根据用户的位置历史记录,进行位置的预测。听起来很玄,事实上,最近在北京就有这样一个例子。一个人丢了钱包和公交卡后,通过研究自己已经丢失的公交卡的公交路线记录,成功找到了拾到他钱包和公交卡的人。这不禁让人有些恐惧,如果有一天,我们的行踪都可以被预测,那我们岂不是活在“楚门的世界”里?

 

《智能手机:普适感知与交互》—  潘纲 浙江大学

潘纲的报告主要介绍了浙大围绕智能手机中的感知器(sensor)所进行的创新性研究,这些研究创意十足,让人惊叹。

先看几个简单的概念:

ü 互联网:Cyberspace信息的及时可共享性

ü 移动互联网:Cyberspace与人连接的持续性

ü 物联网:Cyberspace与物理环境的可通性

ü 社交网络:人的社会性在Cyberspace中的可表达性

在这些概念下,智能手机成为个人与“人物机”三元世界相互沟通的Portalphysical world, cyberspace, humansociety。既然智能手机已经如此普遍,那我们可以用它做些什么呢?

每个智能手机中都有数个内置传感器:加速度传感器、陀螺仪、电子罗盘、亮度传感器、温度传感器、接近传感器、WiFi、蓝牙、GPSNFC(近场通信)、麦克风、FM等等。还有一些外置型的传感器:睡眠传感器、EEG耳机(收集放大脑电波信号)、气压计、化学传感器、心率监测传感器等。

同时,在AndroidIOS平台上,开发者都可以进行传感器相关的开发,都有相应的API可供使用。相比而言,Android平台的API质量要比IOS要低一些。不过,不管在哪个平台上,都不能只是简单的调用API,而需要真正的去理解API的实现过程以及传感器的原理。因为这些API数据并不一定准确,不仅要坐验证,可能还需要做许多后续的处理。比如说,温度传感器放置在CPU旁边,所以CPU的温度会使得其度数偏高。

在了解了传感器和传感器开发之后,进一步思考,这些传感器到底如何应用起来呢?

1.      感知ID

传感器:摄像头、声音、蓝牙,NFC

1) 二维码(QRCode)。一个二维码有三个定位点,供读码器辨别,一个二维码所装载的信息大约为1KB。如今,二维码已经成为O2O商业模式的一个重要媒介。

2) NFC(近场通信)。它的感知范围比较窄,只有4cm,容量大约为1KB -8KB。它的通信方式为TagTag-reader(手机),因此可以用于手机支付、名片交换、身份认证等。浙大这对NFC做了一项有趣的研究,实现了在一个空间区域内的Touch+N的交互方式。用手机Touch各种设备,便可以与这些设备连接、控制他们发声、播放等。

3) Accelerometer。利用加速度感知器,可以识别人的步态、姿态等。

 

2.      感知位置

传感器:WiFiGPSNFCBluetooth

室外定位一般用GPS,地球被分为6个面,每个面由4颗卫星负责。室内定位一般用WiFi,精确度比较高,但是受室内干扰也比较大。

 

3.      感知手势

传感器:加速度仪和摄像头

浙大所做的一项研究,叫做GeeAirA Universal Multimodal Remote Control Device forHome Appliances。用户可以通过手势控制多项设备。比较大的挑战有两个:手势的识别以及不同设备间的控制信号转化。

 

4.      感知情绪

传感器:麦克风

声音的强度、语速、音高等参数会和情绪有一点的联系。比如,在悲伤情绪下,音高下限、音域都很低,语速也慢。于是根据声音可以感知到人的情绪变化,将这样的数据进一步扩大到社交范围中去分析,会有许多有趣的结果。

 

5.      感知用户的行为

传感器:加速度仪、陀螺仪

MIT做过一项有趣的研究:在人的身体上绑五个加速度仪,收集人在活动时的数据,训练出一套识别人类日常行为的系统,准确率在85%以上。

而另外一些应用,如卡路里追踪、行为记录的社交分享等,也是对于用户行为感知所做的挖掘。

 

6.      用户群体的感知

传感器:蓝牙、GPSWiFi

这一类感知主要是感知用户群体同时参与的信息,比如会议、集体活动等。这类感知的应用非常广泛,比如在Foursquare里,到某个酒吧或者咖啡屋之后,便可以查找到附近的人的信息;再比如Color,是一个完全基于位置和用户群体感知的应用,在某个地理位置,可以用幻灯片形式查看附近所有人的照片,并且可以获取周围100英尺内所有人的信息流;SoPhoNet则会在拍照时自动附带参与好友的信息。

 

7.      方向的感知

传感器:电子罗盘、加速度计、陀螺仪

方向的感知,可以有很多有趣的应用。一个手机、一只笔都可以变成控制器,只需要通过简单的指向性操作,就可以控制多种设备。

 

8.      想法的感知

感知人脑的想法,听起来很玄乎的东西。现在普遍的做法有两种:一种是外部的探测,比如脑电图(EEG)、近红外功能性成像,一种是植入性电极。第一种做法精度比较低,但是无害,第二种听上去就比较恐怖。浙大在这个领域做了一个非常酷的研究,拍了一个创意性十足的视频:A Brain-controlled Assistant for theHandicapped:http://v.youku.com/v_show/id_XNDQ2MjUxNTIw.html

 

既然传感器的类型这么多,提供的信息这么丰富,不妨将他们结合起来,做一些更加酷的应用和探索。

1.      城市感知

泛在的智能手机使得大模地采集城市动态数据成可能,其感数据可以:区域人群密度;识别在城市空中的分布;识别不同区域的功能与其它属性;判断不同地域人群的系程度;分析城市人群通模式与律。

比如,晚上10点和早上12点,罗马城的通讯信号强度;有比赛的周末,曼城斯特城的人群聚集密度;根据出租车数据,对城内的一些典型区域进行标注等。


2.      参与感知

参与感知是人们自发的分享、分析传感数据。典型的应用有:校园行随手拍等。


3.      Well-being感知

移动健康应用BeWell便是对用户从三个维度进行感知和打分:睡眠、体育活动、社交。

WalkSafe则是关于行人交通安全的应用。


4.      手机操控智能车

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章