大型移动网站建设,芜湖城建集团,大连app开发制作,2020电商平台排行榜TLD是一种算法的简称#xff0c;原作者把它叫做Tracking-Learning-Detection。搞视觉的人看到这个名字都会吓一跳#xff0c;很ambitious的计划。是09年的工作#xff0c;不算太久#xff0c;不过也不太新。网上关于这个的资源其实很多#xff0c;很大程度和作者开放源代码…TLD是一种算法的简称原作者把它叫做Tracking-Learning-Detection。搞视觉的人看到这个名字都会吓一跳很ambitious的计划。是09年的工作不算太久不过也不太新。网上关于这个的资源其实很多很大程度和作者开放源代码有关。 学习过程中碰到的第一个问题就是资源太多---当然是相对这个领域而言一般能找到一个忠实再现算法的源码就已经很好了。所以把找到的list一下虽然有点浪费时间希望可以对其他人有所帮助。具体的细节就不多说了有很多很棒的分析也列在下面比如zouxy09写的源码注释实在不能再详细了。如果硬要找茬那就是大段的文字让人头晕也没怎么排版。我倒想画几个简单的图补充一下不知有什么好点的画图程序推荐(latex or GNUPlot?没用过) 源代码资源
1. 原作者 Zdenek Kalal
作者主页 http://info.ee.surrey.ac.uk/Personal/Z.Kalal/
源代码页: https://github.com/zk00006/OpenTLD
编程语言Matlab C 2. Alan Torres版
源代码页https://github.com/alantrrs/OpenTLD
实现语言C 3. arthurv版
源代码页https://github.com/arthurv/OpenTLD
实现语言C
注和上面的没有发现任何区别 4. jmfs版
源代码页https://github.com/jmfs/OpenTLD
实现语言C
注和上面两个没有区别只不过加入了VS2010工程文件理论上可以直接在Windows下编译通过。不过opencv检测不到作者的webcam所以他用了另一个VideoInput类来handle摄像头输入。
This is an adaptation of arthurvs fork of OpenTLD (https://github.com/arthurv/OpenTLD)
to be immeadiately runnable in Visual Studio 2010. 5. Georg Nebehay版 终于有个不一样的了。。。。
源代码页http://gnebehay.github.com/OpenTLD/
注1这个的好处是提供可执行文件下载Ubuntu 10.04和Windows。BUT, as you would expect基本上到了你的机器上都跑不了。还是自己老老实实build吧。
注2这个版本需要安装Qt。不过好像作者关掉了Qt的选项相关代码还在所以可以编译但无法显示结果
注3CSDN下载上有个“openTLD Qt 版“就是这个版本。不过加了VS的工程文件---在我的机器上还是不能PnP dont bother
http://download.csdn.net/download/muzi198783/4111915 6. Paul Nader版又一个Qt 版
QOpenTLD: http://qopentld.sourceforge.net/
源代码页 http://sourceforge.net/projects/qopentld/
注1需要OpenCV和Qt。 原系统要求Qt 4.3.7OpenCV 2.2。
注2Windows和Linux下都提供了编译工程或makefile。估计也是唯一一个移植到Android平台下的TLD! 7. Ben Pryke版又一个student project
源代码页https://github.com/Ninjakannon/BPTLD
注依然是MatlabC/C的混合实现。亮点是有很详细的Documentation8页介绍了算法的理解和实现细节。可以帮助理解原算法 博客资源中文
1. 庖丁解牛TLD yang_xian521
http://blog.csdn.net/yang_xian521/article/details/6952870
注1:从文章看作者是基于原作者的matlab版分析的。从函数名看上面的2/3/4应该是matlab---C的直译函数名都没变。这样最好可以和下面的对照着看同时学matlab和C 2. TLDTracking-Learning-Detection学习与源码理解 (zouxy09)
http://blog.csdn.net/zouxy09/article/details/7893011
注1 用的是arthurv版前面说过不能再详细了
注2 下面三个是从这篇copy的 3. 《再谈PN学习》 http://blog.csdn.net/carson2005/article/details/7647519 4. 《比微软kinect更强的视频跟踪算法--TLD跟踪算法介绍》 http://blog.csdn.net/carson2005/article/details/7647500 5. 《TLD视觉跟踪技术解析》 http://www.asmag.com.cn/number/n-50168.shtml 想说的话
1. 分享前段时间把 TLD::init(...)看完了本想一鼓作气其他的事太多只好放下。不过我对detection和tracking比较熟init中已经把learning作了一遍看懂了剩下的就容易了。现在重新捡起无意中发现了zouxy09的注释省了太多力气半天就看完了。很多细节不用自己去抠--- 我们常抱怨这资源那文档太少羡慕老外能力强动作快和他们愿意分享关系太大。经常看到一些不错的文章收藏起来过几天去看居然删了 可以理解可能是开公司要保密但如果害怕别人知道了自己的思路就做不下去那还是不要在这个领域做了。算法只是思想谁也垄断不了。算法也一定是不断更新的 抱着一个算法不放也存活不了几年。原作者也基于这个技术开公司了也没见他们基于这个限制别人使用。SIFTSURF都patent了也没听说赚了大钱kinect告诉你算法也实现不了。要保密的是实现细节 2. 比较 终于看完了实现总的感觉这个算法还是更象工程应用engineering而不是理论突破也不能要求太多了是不是。感觉这么结合后并不一定会比单个的跟踪tracking或检测detection-by-classification模块作的更好毕竟还是没有解决外观(appearence)和尺度(scale)变化这两个根本难题。 不过这种框架反而应该在实际中非常实用因为----------可调的参数太多了!
TLD相信很多人都试过了实时性很多人都在抱怨而且拿到自己的视频上总要调些参数效果才好。 比较起来更喜欢今年ECCV上Kaihua Zhang的Compressive Tracking理论高深的吓人开玩笑源码简单的吓人。而且是目前为止我试过的off-the-shelf的tracker中跟踪效果最好的不用调任何参数绝对实时----代码那么少想不实时都难吧顺便说一句作者的blog就在上面提到过。这才是做研究的方法有个强大的理论做支撑实现可以很简单却不会影响效果。所以如果搞数学的人愿意做应用很多人都会下岗
http://www4.comp.polyu.edu.hk/~cslzhang/CT/CT.htm 另一个PWPPixel-Wise Posteriorspublish时间和TLD差不多性能看上去也很美不过作者说要开源一直没有兑现。是个遗憾。个人觉得level set对部分遮挡效果应该很好做到实时也不是难事
http://www.robots.ox.ac.uk/~cbibby/research_pwp.shtml 3. 总结TLD其实是一个非常合适的入门和进阶算法
a. 有理论有高质量的paperBMVC, CVPR, ICPR, 最后PAMI
b. 有源代码Matlab C Windows, Linux, .....你还想要啥
c. 有不同大牛小牛分享的详细的介绍和详细的代码注释几乎每一行都解释到了
4. 牵涉面广涉及到detection, tracking, classifcation传统的视觉技术就是这么硬梆梆的划分的三大类。研究完了对每一部分多少能有点心得。 The End