|
Departamento
de Engenharia de Computação e Automação Industrial - DCA |
IA718 Tópicos em Sistemas Inteligentes
Professor |
|
Tutor |
|
1- Introdução
2- Programação dinâmica
3- Processo de decisão de Markov
4- Programação dinâmica
Aproximada
5- Aproximações de funções de valor
6- PDA para problemas de
horizonte finito
7- Aproximação de função de
valor
8- Aplicações
1-Introdução
1.1-Porblema e contexto
1.2-Aproximação
do custo futuro
1.3-Arquiteturas
de aproximação
1.4-Simulação
e treinamento
1.4-Programação
dinâmica aproximada
2-Introdução à Programação Dinâmica
2.1-Introdução
2.2-Problema do caminho mínimo
2.3-Solução com programação
dinâmica
2.4-Programação dinâmica forward
2.5-Exemplos
3-Processos de
Decisão de Markov
3.1-Equações de otimalidade
3.2-Problemas com horizonte
finito
3.3-Problemas com horizonte
infinito
3.4-Iteração de valor
3.5-Iteração de estratégia
3.6-Exemplo
4-Programação Dinâmica Aproximada
4.1-Os
três problemas de complexidade da dimensão
4.2-A idéia básica
4.3- Amostragem de variáveis
aleatórias
4.4-PDA utilizando variáveis de
estado pós decisão
4.5-O que é Programação dinâmica
aproximada?
4.6-Questões experimentais
4.7-Relações com aprendizagem por
reforço
5-Aproximação de Funções de Valor
5.1-Aproximação
via agregação
5.2-Aproximação via regressão
5.3-Modelos recursivos de regressão
5.4-Redes neurais
5.5-Aproximação para processos em batelada
6-PDA para problemas com Horizonte Finito
6.1-Estratégias para horizonte
finito
6.2-Aprendizagem-Q
6.3-Diferenças temporais
6.4-Iteração de estratégias
(políticas)
6.5-Monte Carlo e iteração de
estratégias
6.6 –Taxonomia de estratégias de
PDA
7-Aproximações de
Funções de Valor
7.1-Funções de valor e gradiente
7.2-Aproximações
lineares
7.3-Aproximação
linear por partes
7.4-Regressão
7.5-Planos
de corte
8-Aplicações
N = (P1 +
P2+P)/3, E = Exame, P =
Projeto
Se N < 5 então Exame
Se N > 5 aprovado nota N
Se (N+E)/2 <
5 reprovado
Se (N+E)/2 >
5 aprovado nota (N+E)/2
Se necessário:
exame oral.
Prova |
Data |
P1 |
|
P2 |
|
Exame |
|
|
Approximate
Dynamic Programming, W. Powell Wiley, 2007 |
|
Neuro-Dynamic
Programming, D. Bertsekas and J. Tsitsiklis Atena Scientific, 1996 |
|
Artificial
Intelligence: A Modern Approach, S. Russell, P. Norvig Prentice
Hall, 2003 |