如何贡献Eclipse Deeplearning4j源代码。
在做出贡献之前,确保你知道所有的Eclipse DL4J库的结构。早在2018年初,所有的库都入住在Deeplearning4j monorepo。这些包括:
DeepLearning4J: 包含用于既在单个机器上,又在分布式上学习神经网络的所有代码。
ND4J: “Java的n维数组”。ND4J是建立DL4J的数学后端。所有的DL4J神经网络都是使用ND4J中的运算(矩阵乘法、向量运算等)来构建的。ND4J是DL4J实现在没有改变网络本身的情况化,即可以CPU又可以GPU训练网络的原因。 没有Nd4J,就不会有DL4J。
DataVec: DataVec处理管道侧的数据导入和转换。如果你 想将图像、视频、音频或简单CSV数据导入DL4J:你可能想要使用DataVec来实现。
Arbiter: Arbiter是一种用于神经网络超参数优化的软件包。超参数优化是指自动选择网络超参数(学习速率、层数等)以获得良好性能的过程。
我们也有一个额外的示例仓库在 dl4j-examples.
有多种方式为DeepLearning4J (和相关项目)做贡献,这取决于你的兴趣和经验。这有一些建议:
添加一个新的神经网络类型 (例如: 不同类型的 RNNs, 本地连接网络等)
添加一个新的训练特征
修复缺陷
DL4J 示例: 那儿有我们没有示例的程序或神经网络架构吗?
测试性能和识别瓶颈或可以改进的地方。
改进网站的文档(或写教程等)
改进java文档
这有很多不同的方法来寻找工作。这些包括:
回顾我们的路线图
与开发人员交谈,特别是我们的早期使用者栏目
回顾最近的论文和博客文章关于训练特征、神经网络架构和应用。
回顾网站和例子-有什么什么似乎缺少,不完整,或只是有用的(或酷)?
在你开始做之前,有一些事情你需要知道。特别是我们使用的工具:
Maven: 一个依赖性管理和构建工具,用于我们所有的项目。有关Maven的详细信息,请参见此。
Git: 我们使用的版本控制系统
Project Lombok: Lombok项目是一种代码生成/注释工具,其目的是减少Java中所需的“多余”代码(即标准重复代码)的数量。要使用源代码,你需要为IDE安装Lombok插件。
VisualVM:分析工具,最有效的识别性能问题和瓶颈。
IntelliJ IDEA: 这是我们的IDE选择,当然,你可能会使用替代品,如Eclipse和NetBeans,你可能会发现使用与开发人员相同的IDE更容易避免出现问题。但这取决于你。
要记住的事情:
代码应该符合Java 7 或以上
如果你添加一个新的方法或类:添加java文档
为一个明显的功能添加添加一个作者标签是受大家欢迎的。这也可以帮助特征贡献者,以防他们需要问原作者问题。如果多个作者出现在一个类中:提供谁做了什么的细节(“初始实现”,“添加一个特征”等)
在你的代码中提供有益的注释。这有助于保持所有代码的可维护性。
任何新的功能都应该包括单元测试(使用JUnit)来测试代码。这应该包括边缘情况。
如果添加新的层类型,则必须按照这些单元测试包含数值梯度检查。这些是必要的,以确认计算的梯度是正确的。
如果你正在添加重要的新功能,请考虑更新网站的相关部分,并提供一个示例。毕竟,没有人知道的功能(或者没有人知道如何使用)是没有用的。添加合适的文档是非常受到鼓励的,但不是严格要求的。
如果你对某些事不确定,请在Gitter 上咨询我们。