14:04:49 From Aluno 1 : aqui convergiu para a solução correta no sobredeterminado; e para uma solução correta, mas não a de norma mínima, no subdeterminado... será que fiz algo errado?... 14:05:27 From Aluno 1 : achei que tinha implementado na versão default.... 14:10:27 From Aluno 2 : Tive esse comportamento também, quando inicia na origem 14:12:11 From Aluno 2 : com os parâmetros default, convergiu quando partiu da origem no sobredeterminado 14:13:58 From Aluno 1 : betas 0.9 e 0.999 epsilon 10^{-7} passo 0.001 14:14:01 From Aluno 1 : é isso? 14:14:55 From Aluno 1 : aqui está convergindo... 14:16:27 From Aluno 3 : sim 14:19:59 From Aluno 2 : Talvez os números aleatórios na matlab sejam diferentes dos números gerados no octave. Ficariam problemas diferentes. 14:20:54 From Aluno 1 : ah, talvez minha matriz aleatoria X esteja "melhor" para o ADAM 14:22:00 From Aluno 3 : Fernando você chegou olhar sobre a constante de 2/m que multiplica o gradiente ? 14:23:46 From Aluno 2 : Minha implementação estava com Epsilon 1e-8. Pode ter sido essa a diferença. 14:24:00 From Aluno 1 : aqui funcionou para os 2 14:24:15 From Aluno 3 : Pagina 124 capitulo 4 14:30:30 From Aluno 1 : ele nunca converge para uma errada... 14:30:42 From Aluno 1 : porque o passo não reduz se o gradiente não diminuir 14:31:09 From Aluno 1 : na implementação fornecida do SGD tinha o valor da iteração dividindo o passo, eu removi isso 14:31:27 From Aluno 1 : vou explorar mais 14:34:10 From Aluno 1 : perfeito, é que não entendi como ele pode ter convergido para um ponto de gradiente não nulo, achei que pudesse ser isso 14:41:12 From Aluno 4 : Professor, minha duvida era saber como é o formalismo para apresentar a demostracao no 2 14:46:14 From Aluno 5 : entendi, agora 14:49:57 From Aluno 4 : Sim 14:50:00 From Aluno 4 : Hoyos 14:53:36 From Aluno 6 : Podería dar uma dica da Q3. Tem que ser um formalismo com referencia nos autovalores? 14:53:43 From Aluno 4 : Entendi 14:55:00 From Professor : Matriz ortogonal -> Q^T*Q=I 14:55:18 From Professor : N é uma matriz diferente de Q*N 15:30:01 From Aluno 4 : Professor, no e-mail que enviei, estava me referindo a como definir a equação para derivar, ou seja, eu poderia definir tudo como uma função em relação apenas a x e depois derivar, isso é válido ou é um erro matemático? Não sei se o senhor é bastante rigoroso com esse tipo de formalização quando se trata de apresentar os resultados. ou a função deve ser definida devido a todos os parâmetros? por exemplo, F (x, A, x0 ...) ou pode ser F (x). Peço desculpas, às vezes fica difícil me expressar em português 15:31:24 From Aluno 4 : É que na minha universidade é meio forte esquecer esse tipo de questoes 15:34:48 From Aluno 4 : Muito obrigado professor! 15:34:56 From Aluno 6 : Obrigado, profesor