大家好,我想在这里给大家介绍我的一个项目:MobulaOP. MobulaOP是一个简单且灵活的跨框架算子创建工具。使用MobulaOP, 不需要重新编译深度学习框架的源码,就可以创建自定义的C++算子。而且只需要一份C++代码和简单的定义,自定义算子就可以在CPU和GPU上运行。
之所以建立这个项目,是因为我发现MXNet创建自定义算子的方法不太方便,其他深度学习框架也存在这个问题。 当前,创建自定义算子的方法主要为:
- 重新编译深度学习框架的源码 重新编译源码耗时过长。需要了解对应框架的算子实现形式,编写出的代码不适用于其他框架。