Com base nos conceitos dos tipos de aprendizado de máquina, julgue os itens a seguir.
I - O aprendizado por reforço envolve descobrir como jogar um jogo de múltiplos estágios com recompensas.
II - No aprendizado de máquina não supervisionado, o usuário fornece ao algoritmo pares de entradas e saídas desejadas, e o algoritmo encontra uma maneira de produzir a saída desejada dada uma entrada.
III - O aprendizado supervisionado envolve descobrir o que torna os dados especiais, assim nenhum rótulo é dado ao algoritmo de aprendizado, deixando-o sozinho para encontrar a estrutura em sua entrada.
A)
Item II e III: ERRADOS. Os itens estão com os conceitos trocados. Para estar correto, o item II deveria tratar do aprendizado supervisionado e o item III do aprendizado NÃO supervisionado.
O Processo de Linguagem Natural (PNL) consiste em um ramo da inteligência artificial que ajuda os computadores a entender, interpretar e manipular a linguagem humana. Nesse contexto, Robert Dale (Handbook of Natural Language Processing, 2010)
sugere que o PNL acontece em estágios. O estágio que busca estudar a morfologia das palavras e recuperar informação que será útil em níveis mais profundos de análise, onde realiza uma decomposição morfológica para identificar classes
gramaticais de cada um dos tokens selecionados, é chamado de:
E)
A ordem dos estágios proposta e apresentada no curso é a seguinte:
A respeito dos conhecimentos acerca de Big Data e bancos de dados não relacionais, indique a alternativa que traz informações corretas:
E)
O Big Data trabalha dados que vão além de dados estruturados típicos, pois grande parte das informações hoje em dia não são
estruturadas.
Apesar de o volume de dados ser fator crucial de um Big Data, é errado dizer que SOMENTE envolve soluções com petabytes de dados, uma vez que o mais importante é a capacidade de extrair valor dos dados.
Não é possível prever o futuro com base nos dados passados, mas é possível desenhar tendências e possíveis cenários.
Apesar do Big Data fornecer uma base robusta para tomada de decisões e resolução de problemas, existem situações não quantificáveis que não são resolvidas simplesmente pelo Big Data.
Trata-se de um atributo dos dados onde os valores pertencem a um intervalo de números reais e representam uma mensuração:
A)
Trata-se do atributo chamado “Continuo”: Os valores pertencem a um intervalo de números reais e representam uma mensuração (Ex: altura de uma pessoa, peso de uma marmita, salário de um servidor público, entre outros).
No contexto de Big Data, trata-se de um volumoso repositório de dados geralmente tratados (limpos, combinados, organizados, etc) antes de serem armazenados, que possui um
esquema previamente definido e que é ideal para usuários operacionais aplicarem ferramentas de análise de dados. Trata-se da definição de:
A)
Outras características que fazem parte da sua definição:
- Podem armazenar todos os tipos de dados, mas o foco é nos dados estruturados.
- Armazenamento de dados custam geralmente mais caro e consome mais tempo.
Bancos de dados não-relacionais utilizam modelos diferentes de armazenamento de dados. O modelo que armazena o relacionamento entre dados altamente conectados por meio de vértices e arestas e que geralmente são utilizados em redes
sociais, mecanismos de recomendação e detecção de fraudes são do tipo:
D)
Um banco de dados orientado a grafos representa os dados de acordo com a Teoria de Grafos. Um grafo é um modelo matemático capaz de representar relações entre elementos sendo formado por dois conjuntos: um de vértices e um
de arestas. (Ex: Neo4J, Infinite Graph e ArangoDB).
Ferramentas de Business Intelligence propiciam uma análise de dados capaz de embasar diversos insights aos negócios de uma companhia. Em certo nível é possível até mesmo prever o que pode acontecer com base em dados históricos. Nessa
situação, estamos diante de uma análise:
B)
A análise preditiva consiste em colocar o aprendizado de máquina em uso para prever possíveis cenários futuros.
No cenário de computação em nuvem, determinado modelo de serviço consiste na capacidade oferecida pelo provedor para o
desenvolvimento de aplicativos que serão executados e disponibilizados na nuvem, onde a plataforma na nuvem oferece um modelo de computação, armazenamento e comunicação para os aplicativos. Assinale a alternativa que indica esse modelo de serviço:
C)
PaaS (Platform as a Service): oferece uma plataforma de
alto nível de integração para implementar e testar aplicações na nuvem. Exemplo: Google AppEngine e Microsoft Azure.
Acerca da mineração de dados (“Data Mining”), julgue os itens a seguir.
I - Data Mining é o processo de explorar grande quantidade de dados para extração trivial de informação conhecida.
II - A mineração de dados do tipo diagnóstica é utilizada para entender os dados e/ou encontrar causas de problemas.
III - A mineração de dados só pode ocorrer em bancos de dados muito grandes como Data Warehouses.
B)
- Data Mining é o processo de explorar grande quantidade de dados para extração NÃO-trivial de informação IMPLÍCITA DESCONHECIDA.
- a mineração pode ser do tipo diagnóstica e do tipo preditiva.
- Apesar de ser mais comumente utilizado em bancos de dados grandes, não há exigência que a mineração de dados seja feita
apenas nessas situações.
Os dados podem ser classificados em dados estruturados, não estruturados e semiestruturados. Nesse sentido, escolha a
alternativa que apresenta informações corretas acerca dos tipos de dados.
chamados de dados não estruturados.
B)
- dados ESTRUTURADOS -> formato fixo e armazenado em linhas e colunas
- fotos, músicas e vídeos são exemplos de dados NÃO estruturados.
- O Big Data contém tanto dados estruturados como não estruturados.
- Os dados armazenados e controlados em banco de dados são estruturados.
Existem muitos tipos de objetos no R. Considerando a definição e particularidades dos objetos no R, encontre a alternativa correta:
B)
- vetor lógico ou booleano, que assume valores TRUE e FALSE.
- Funções são objetos do R, matrizes são coleções de vetores em linhas e colunas.
- Dataframe aceita que vetores tenham diferentes tipos.
- O vetor “character” permite textos, exemplo: “o gabarito desta questão é letra X”.
Considere o programa a seguir, escrito em R.
> x <- c (1, 2, 3, 4, 20)
> m <- mean (x)
> print(m)
Indique a alternativa que apresenta o retorno de “print(m)”:
A)
função mean calcula a média do conjunto (1, 2, 3, 4, 20) e
print[m] traz o resultado dessa média = 6
m = (1 +2+3+4+20)/5 = 6
Com base na linguagem Python, julgue os itens a seguir.
I - É uma linguagem compilada.
II - É uma linguagem de programação de baixo nível
III - É uma linguagem multiparadigma.
D)
É uma linguagem de ALTO nível. Trata-se de uma linguagem com nível de abstração bastante elevado (longe da linguagem de máquina).
É uma linguagem INTERPRETADA. Seu código-fonte é executado linha a linha por um interpretador (software que traduz uma linguagem em outra) e depois pelo sistema operacional.
É uma linguagem multiparadigma porque suporta mais de um paradigma de programação. No caso, eles são: imperativo, procedural, funcional e orientado a objetos.
A respeito dos conhecimentos acerca de Big Data e bancos de dados não relacionais, indique a alternativa que traz informações incorretas:
C)
Big Data trabalha dados que vão além de dados estruturados típicos, já que grande parte das informações hoje em dia não são estruturadas.
Sobre o tema “Computação em Nuvem” escolha a alternativa correta:
conveniente e sob demanda.
e) Uma das vantagens da computação em nuvem é a de desvincular a TI de esforços estratégicos de interesse da cúpula da organização.
B)
- A redução dos custos figura como uma das principais vantagens do cloud computing.
- Em regra a responsabilidade é terceirizada para a prestadora de serviço de nuvem – tanto de armazenamento quanto de atualização, backup, manutenção, escalonamento, entre
outros.
- Computação em nuvem é a forma de utilizar memória computacional e local de armazenamento de arquivos em computadores interligados à Internet, podendo esses arquivos ser acessados de qualquer lugar do mundo conectado a esta rede.
- a TI passa a observar mais as questões estratégicas, pois os serviços mais operacionais ficam facilitados por meio do cloud