-
The new paper ["Image Augmentations for GAN Training"](https://arxiv.org/abs/2006.02595#google), Zhao et al 2020b, reports:
> Data augmentations have been widely studied to improve the accuracy and…
gwern updated
3 years ago
-
# 高级凸优化
这部分是MXNet第六课的高级凸优化的学习记录,包含基本的凸函数性质说明,主要讲解了收敛率以及后面的高级优化算法,包括动量法、Adagrad、AdaDelta、RMSProp、Adam。重点介绍了一个由动量法引入的EMA(Exponential Moving Average,即指数平均数指标),在包括Adam等等优化算法都有它的身影。
## 1. 凸函数性质
好…
-
### 深層学習 day1
- 00_プロローグ1_識別モデルと生成モデル
> 機械学習モデルを入力・出力の目的で分類
> 識別モデル・・・データを目的のクラスに分類する、データ量の多いものからデータ量の少ないものに変換する
> 生成モデル・・・特定のクラスのデータを生成する、データ量の少ないものからデータ量の多いものに変換する
> p(Ck|x)・・・あるデータxが与えられた条件の下で…
-
> PyTorch 是由 Facebook 开发,基于 **Torch** 开发,从并不常用的 Lua 语言转为 Python 语言开发的深度学习框架,Torch 是 TensorFlow 开源前非常出名的一个深度学习框架,而 PyTorch 在开源后由于其使用简单,动态计算图的特性得到非常多的关注,并且成为了 TensorFlow 的 最大竞争对手。目前其 Github 也有 2w8+ 关注。
…
-
## Intro to Tensorflow
- 在tensorflow中,数据是被封装在一个Object叫tensor。
### Session
- TensorFlow’s api是构建基于Computational Graph(计算图)上的。
- TensorFlow Session **is an environment for running a graph.**
```p…
-
Hi,
Are you planning on releasing a pretrained model anytime?
Thanks
-
Hi,
I'm trying to get some deeper insight in the code of sempre.
For the moment, I'm looking at the simple Java logical forms
and their execution by the class JavaExecutor-
The class CallFormula f…
-
paper: https://arxiv.org/pdf/1907.02893
paper section to read:
3.2 Implementation details
When estimating the objective (IRMv1) using mini-batches for stochastic gradient
descent, one can obtain …
-
The "Modeling XOR with a neural network" example don't work.
The loss increases until it become `NaN`
[modeling_xor_with_a_neural_network.livemd.zip](https://github.com/user-attachments/files/16…
-
Hi,
Thanks for sharing the impressive code!
The computation cost of this repo is higher than expected. As [LLaMA-Factory](https://github.com/hiyouga/LLaMA-Factory) suggested, a 7B model would only…
zhmzm updated
3 months ago