Departamento de Engenharia de Computação e Automação Industrial - DCA

Faculdade de Engenharia Elétrica e de Computação - FEEC

Universidade Estadual de Campinas - UNICAMP

IA718 Tópicos em Sistemas Inteligentes

Professor	Fernando Gomide
Tutor

Conteúdo

Ementa
Critério de avaliação
Referências bibliográficas
Provas
Recursos de software
Notas de aula
Listas de exercícios
FAQ
Notas

Ementa

Ementa resumida

1- Introdução

2- Programação dinâmica

3- Processo de decisão de Markov

4- Programação dinâmica Aproximada

5- Aproximações de funções de valor

6- PDA para problemas de horizonte finito

7- Aproximação de função de valor

8- Aplicações

Ementa detalhada

1-Introdução

1.1-Porblema e contexto

1.2-Aproximação do custo futuro

1.3-Arquiteturas de aproximação

1.4-Simulação e treinamento

1.4-Programação dinâmica aproximada

2-Introdução à Programação Dinâmica

2.1-Introdução

2.2-Problema do caminho mínimo

2.3-Solução com programação dinâmica

2.4-Programação dinâmica forward

2.5-Exemplos

3-Processos de Decisão de Markov

3.1-Equações de otimalidade

3.2-Problemas com horizonte finito

3.3-Problemas com horizonte infinito

3.4-Iteração de valor

3.5-Iteração de estratégia

3.6-Exemplo

4-Programação Dinâmica Aproximada

4.1-Os três problemas de complexidade da dimensão

4.2-A idéia básica

4.3- Amostragem de variáveis aleatórias

4.4-PDA utilizando variáveis de estado pós decisão

4.5-O que é Programação dinâmica aproximada?

4.6-Questões experimentais

4.7-Relações com aprendizagem por reforço

5-Aproximação de Funções de Valor

5.1-Aproximação via agregação

5.2-Aproximação via regressão

5.3-Modelos recursivos de regressão

5.4-Redes neurais

5.5-Aproximação para processos em batelada

6-PDA para problemas com Horizonte Finito

6.1-Estratégias para horizonte finito

6.2-Aprendizagem-Q

6.3-Diferenças temporais

6.4-Iteração de estratégias (políticas)

6.5-Monte Carlo e iteração de estratégias

6.6 –Taxonomia de estratégias de PDA

7-Aproximações de Funções de Valor

7.1-Funções de valor e gradiente

7.2-Aproximações lineares

7.3-Aproximação linear por partes

7.4-Regressão

7.5-Planos de corte

8-Aplicações

Critério de avaliação

N = (P1 + P2+P)/3, E = Exame, P = Projeto

Se N < 5 então Exame

Se N > 5 aprovado nota N

Se (N+E)/2 < 5 reprovado

Se (N+E)/2 > 5 aprovado nota (N+E)/2

Se necessário: exame oral.

Provas

Prova	Data
P₁
P₂
Exame

Referências Bibliográficas

Teoria
Periódicos

Teoria

Livro texto:

Approximate Dynamic Programming, W. Powell

Wiley, 2007

Outros:

Neuro-Dynamic Programming, D. Bertsekas and J. Tsitsiklis

Atena Scientific, 1996

Artificial Intelligence: A Modern Approach, S. Russell, P. Norvig

Prentice Hall, 2003

Periódicos

Mathematical Programming

Operations Research
European Journal of Operational Research
Journal of the Operational Research Society
Interfaces
Computers and Operations Research
International Transactions in Operational Research
Decision Support systems
Management Science
IEEE Transactions on Systems, Man, Cybernetics
Networks
Naval Research Logistics
Transportation Science
Transportation Research

Críticas, dúvidas e sugestões: