Departamento de Engenharia de Computação e Automação Industrial - DCA
Faculdade de Engenharia Elétrica e de Computação - FEEC
Universidade Estadual de Campinas - UNICAMP

 

IA718     Tópicos em Sistemas Inteligentes

 

Professor

Fernando Gomide

Tutor

 

Conteúdo


Ementa

Ementa resumida

1- Introdução

2- Programação dinâmica

3- Processo de decisão de Markov

4- Programação dinâmica Aproximada

5- Aproximações de funções de valor

6- PDA para problemas de horizonte finito

7- Aproximação de função de valor

8- Aplicações

 

Ementa detalhada

1-Introdução

     1.1-Porblema e contexto

      1.2-Aproximação do custo futuro

      1.3-Arquiteturas de aproximação

      1.4-Simulação e treinamento

      1.4-Programação dinâmica aproximada

2-Introdução à Programação Dinâmica

2.1-Introdução

2.2-Problema do caminho mínimo

2.3-Solução com programação dinâmica

2.4-Programação dinâmica forward

2.5-Exemplos

3-Processos de Decisão de Markov

3.1-Equações de otimalidade

3.2-Problemas com horizonte finito

3.3-Problemas com horizonte infinito

3.4-Iteração de valor

3.5-Iteração de estratégia

3.6-Exemplo

4-Programação Dinâmica Aproximada

4.1-Os três problemas de complexidade da dimensão

4.2-A idéia básica

4.3- Amostragem de variáveis aleatórias

4.4-PDA utilizando variáveis de estado pós decisão

4.5-O que é Programação dinâmica aproximada?

4.6-Questões experimentais

4.7-Relações com aprendizagem por reforço

5-Aproximação de Funções de Valor

     5.1-Aproximação via agregação

     5.2-Aproximação via regressão

     5.3-Modelos recursivos de regressão

     5.4-Redes neurais

     5.5-Aproximação para processos em batelada

6-PDA para problemas com Horizonte Finito

6.1-Estratégias para horizonte finito

6.2-Aprendizagem-Q

6.3-Diferenças temporais

6.4-Iteração de estratégias (políticas)

6.5-Monte Carlo e iteração de estratégias

6.6 –Taxonomia de estratégias de PDA

7-Aproximações  de Funções de Valor

            7.1-Funções de valor e gradiente

            7.2-Aproximações lineares

            7.3-Aproximação linear por partes

            7.4-Regressão

            7.5-Planos de corte

      8-Aplicações


Critério de avaliação

          N = (P1 + P2+P)/3,   E = Exame, P = Projeto

          Se N < 5  então Exame

         Se N  > 5 aprovado nota N

         Se (N+E)/2 < 5  reprovado

         Se (N+E)/2 > 5  aprovado nota (N+E)/2

      Se necessário: exame oral.


Provas

Prova
Data

P1

 

P2

 

Exame

 

 


 

Referências Bibliográficas


Teoria

 

Livro texto:

 

Approximate Dynamic Programming, W. Powell

Wiley, 2007

Outros:

 

Neuro-Dynamic Programming, D. Bertsekas and J. Tsitsiklis

Atena Scientific, 1996

 

Artificial Intelligence: A Modern Approach, S. Russell, P. Norvig

Prentice Hall, 2003

 

 

Periódicos

 

 

 


Críticas, dúvidas e sugestões: