Computação Gráfica: Transformações em Imagens Matriciais
Afluentes: Computação Gráfica
Transformações Geométricas
As transformações geométricas são operações de processamento de imagem para alterar a posição inicial dos seus píxels. Dentre algumas operações, temos ampliação, diminuição, espelhamento, rotação, distorção, etc.. Veremos alguns deles aqui.
Para nossos testes, iremos utilizar a imagem abaixo:
Alteração de Dimensões
Na alteração de dimensões de uma imagem, alteramos as proporções da saída gravando em arquivo contendo a imagem alterada, seja ela ampliada ou reduzida. Na literatura técnica de processamento de imagens existem dois tipos de alterações de dimensões de uma imagem, embora tecnicamente idênticos:
- scaling a imagem é ampliada ou reduzida por um fator (que pode ser igual para as dimensões horizontal e vertical / preservando a relação de aspecto original / ou não);
- sizing (ou resizing) é utilizado nos casos em que, ao invés de especificar o fator de ampliação / redução, o usuário especifica o novo tamanho que a imagem deve possuir.
Se quisermos ampliar a imagem, a nova imagem resultante deve possuir o tamanho necessário para comportá-la. A nova imagem irá conter uma quantidade de pixeis maior do que a original. Então, pelo método mais simples, replicamos os pixeis na nova imagem.
Veja que conforme o tamanho da imagem podemos ter um resultado visual onde podemos observar grandes quadriculados referente aos pixeis de origem. Existem algoritmos para suavizar essa percepção.
Abaixo temos um programa em python que faz um scaling em uma imagem alterando a largura e altura para manter o aspecto original.
1import sys
2import pygame
3
4# Retorna x e y equivalente da imagem original na destino
5def get_dest_xy(x_orig, y_orig, proportion):
6 x = int(proportion * x_orig / 100) # calcula a regra de tres de x
7 y = int(proportion * y_orig / 100) # calcula a regra de tres de y
8 return x, y
9
10# Retorna x e y equivalente da imagem destino na original
11def get_orig_xy(x_dest, y_dest, proportion):
12 p = 100 / (proportion / 100) # pega o percentual invertido
13 x = int(p * x_dest / 100) # calcula a regra de tres de x
14 y = int(p * y_dest / 100) # calcula a regra de tres de y
15 return x, y
16
17# Redimensiona a imagem
18def resize(image, surface, proportion):
19 # Para cada coluna da imagem de destino
20 for y in range(surface.get_height()):
21 # Para cada linha da imagem de destino
22 for x in range(surface.get_width()):
23 # pega o x e y relativo da imagem original
24 x2, y2 = get_orig_xy(x, y, proportion)
25 # e pinta na imagem de destino
26 surface.set_at((x, y), image.get_at((x2, y2)))
27
28# PROGRAMA PRINCIPAL
29pygame.init()
30
31file_in = sys.argv[1]
32file_out = sys.argv[2]
33proportion = int(sys.argv[3])
34
35image = pygame.image.load(file_in)
36w = image.get_width()
37h = image.get_height()
38sw, sh = get_dest_xy(w, h, proportion)
39
40# cria a surface com a proporção a ser alterada
41surface = pygame.display.set_mode((sw, sh))
42
43# chama a função pra redimensionar
44resize(image, surface, proportion)
45
46# salva a surface como nova imagem
47pygame.image.save(surface, file_out)
48
49pygame.display.set_caption(file_in)
50
51finish = False
52while not finish:
53 for event in pygame.event.get():
54 if event.type == pygame.QUIT:
55 finish = True
56 elif event.type == pygame.KEYDOWN:
57 if event.key == pygame.K_ESCAPE:
58 finish = True
59 pygame.display.update()
60pygame.quit()
61quit()
- Exemplo de execução
python3.9 resize.py imagem.jpg out.jpg 120
O exemplo aumenta a imagem em 20% da original (imagem.jpg), criando uma imagem resultado chamada out.jpg.
- Exercício
- Altere o algoritmo para redimensionar apenas a largura e depois apenas a altura. Observe que a imagem irá ficar espichada.
Espelhamento
A operação de espelhamento consiste em inverter a imagem. No caso do espelhamento horizontal, é como se estivéssemos vendo por um espelho. Quando usamos um espelhamento vertical, a imagem fica de ponta cabeça.
A operação consiste, no caso do horizontal. Para cada píxel de uma linha, ele pega o primeiro e coloca na última posição da imagem de destino. Depois pega o segundo e coloca na penúltima posição. Esse procedimento ocorre até que todos os pixeis da linha tiverem sido colocado na sua respectiva posição da imagem de destino. Depois segue para a próxima linha até que toda a imagem tenha sido rasterizada.
O programa em python abaixo faz o espelhamento horizontal da imagem.
1import sys
2import pygame
3
4# Função de espelhamento. O resultado é colocado em surface
5def flip(image, surface):
6 w = image.get_width()
7 h = image.get_height()
8 for y in range(h):
9 for x in range(w):
10 # coloca o último pixel na primeira posição,
11 # o penúltimo na segunda, e assim por diante.
12 surface.set_at((w - 1 - x, y), image.get_at((x, y)))
13
14
15# PROGRAMA PRINCIPAL
16pygame.init()
17
18file_in = sys.argv[1]
19file_out = sys.argv[2]
20
21image = pygame.image.load(file_in)
22w = image.get_width()
23h = image.get_height()
24
25# cria a surface com a proporção a ser alterada
26surface = pygame.display.set_mode((w, h))
27
28# chama a função fazer o espelhamento
29flip(image, surface)
30
31# salva a imagem
32pygame.image.save(surface, file_out)
33
34pygame.display.set_caption(file_in)
35
36finish = False
37while not finish:
38 for event in pygame.event.get():
39 if event.type == pygame.QUIT:
40 finish = True
41 elif event.type == pygame.KEYDOWN:
42 if event.key == pygame.K_ESCAPE:
43 finish = True
44 pygame.display.update()
45pygame.quit()
46quit()
- Execução
python3.9 flip.py image.jpg flip.jpg
- Exercícios
- Altere o programa para fazer o espelhamento vertical da imagem.
Rotação
Uma imagem pode ser rotacionada de um ângulo arbitrário, tanto no sentido horário quanto no anti-horário. Rotações com ângulos múltiplos de 90º são mais simples de implementar, pois consistem na cópia de pixels que estão organizados em linhas, reordenando-os em colunas na direção em que se deseja rotacionar a imagem. A figura 25 ilustra o processo de rotação de 90º no sentido horário. A área tracejada destaca as primeiras linhas da imagem original, que são reposicionadas em formas de colunas, da direita para a esquerda, na imagem rotacionada.
Rotações diferentes requerem operações mais complexas, como no caso do exemplo a seguir em que a imagem foi rotacionada em 15º.
Observe que quando rotacionamos, tanto a largura quanto a altura são aumentadas para comportar a imagem em sua totalidade. Logo, a imagem resultante será maior que a original.
Para calcular o tamanho da nova imagem, precisamos rotacionar os vértices da imagem original pelo ângulo requerido. Depois pegamos o x mínimo de todos os vértices, o x máximo, assim como o y mínimo e o y máximo. Então teremos o tamanho da imagem como:
Ok, com isso temos a largura e altura da nova imagem. Contudo, ainda não vimos a fórmula da rotação.
A operação de rotação ocorre com a multiplicação da matriz de Rotação com todos os píxeis da imagem. Porém, é importante observar que a matriz de rotação, no caso de uma imagem matricial, é apenas nos eixos x e y. No espaço tridimensional, temos a rotação em todos os eixos (x, y e z). Dessa forma, as matrizes de rotação são apresentadas a seguir:
tal que:
θ é o ângulo, em radianos, que se quer rotacionar o objeto, sin é a operação do seno sobre o ângulo e cos é a operação do cosseno sobre o ângulo.
Logo, a fórmula matemática da operação de translação fica da seguinte forma:
tal que:
Um problema é que se simplesmente rotacionarmos a imagem, ela irá se basear no seu ponto de origem (0, 0). Então vários pontos acabam saindo da área onde a imagem deve ser representada.
Dessa forma, precisamos mover nosso ponto de origem para o meio da imagem. Ou melhor, movemos a imagem para que seu ponto de origem coincida com o ponto (0, 0). Essa é uma operação de translação.
A operação da translação ocorre com a soma da matriz de translação com todos os pontos do objeto. A matriz de translação é a seguinte:
tal que:
Tx é a translação na horizontal e Ty é a translação na vertical
Logo, a fórmula matemática da operação de translação fica da seguinte forma:
tal que:
Com a fórmula da translação, então devemos fazer o seguinte:
- Para cada ponto da imagem
- Pego o meio da imagem original
- translado para o negativo do meio da imagem original
- rotaciono o ponto
- translado considerando o meio da imagem de destino
A seguir temos um código em python para rotação da imagem. Veja que existem píxeis na imagem que não estão pintados. Esse algoritmo é simplificado e poderia ser melhorado.
1import sys
2import pygame
3import math
4
5
6# Rotaciona um ponto x, y pelo angulo ang.
7def rot_xy(x, y, ang):
8 x2 = (x * math.cos(ang)) + (y * -math.sin(ang))
9 y2 = (x * math.sin(ang)) + (y * math.cos(ang))
10 return int(x2), int(y2)
11
12
13# Pego o novo tamanho da imagem
14def get_new_image_size(w, h, ang):
15 # pega todos os vertices do retangulo
16 vertex = [[0, 0], [w, 0], [w, h], [0, h]]
17 print(vertex)
18 # rotaciona todos os pontos
19 for i in range(4):
20 x, y = rot_xy(vertex[i][0], vertex[i][1], ang)
21 vertex[i] = [x, y]
22 print(vertex)
23 # pega os mínimos e máximos
24 x_min = 0
25 y_min = 0
26 x_max = 0
27 y_max = 0
28 for i in range(4):
29 if vertex[i][0] < x_min:
30 x_min = vertex[i][0]
31 if vertex[i][0] > x_max:
32 x_max = vertex[i][0]
33 if vertex[i][1] < y_min:
34 y_min = vertex[i][1]
35 if vertex[i][1] > y_max:
36 y_max = vertex[i][1]
37 return (x_max - x_min), (y_max - y_min)
38
39
40# Função de espelhamento. O resultado é colocado em surface
41def rotation(image, surface, ang):
42 w_orig = image.get_width() # largura da imagem de origem
43 h_orig = image.get_height() # altura da imagem de origem
44
45 w_mid_orig = int(w_orig / 2) # metade da largura da imagem de origem
46 h_mid_orig = int(h_orig / 2) # metade da altura da imagem de origem
47
48 w_dest = surface.get_width() # largura da imagem de destino
49 h_dest = surface.get_height() # altura da imagem de destino
50
51 w_mid_dest = int(w_dest / 2) # metade da largura da imagem de estino
52 h_mid_dest = int(h_dest / 2) # metade da altura da imagem de destino
53
54 for y in range(h - 1): # para cada linha da imagem de origem
55 for x in range(w - 1): # para cada coluna da imagem de origem
56 # translada o ponto para o meio negativo da imagem de origem
57 xaux = x - w_mid_orig
58 yaux = y - h_mid_orig
59 # rotaciona o ponto
60 xaux, yaux = rot_xy(xaux, yaux, ang)
61 # translada o ponto pegando o meio da imagem de destino
62 xaux = xaux + w_mid_dest
63 yaux = yaux + h_mid_dest
64 # imprime o pixel na posição calculada da imagem de destino
65 surface.set_at((xaux, yaux), image.get_at((x, y)))
66
67
68# PROGRAMA PRINCIPAL
69pygame.init()
70
71file_in = sys.argv[1]
72file_out = sys.argv[2]
73# o angulo é horário, vamos trabalhar no anti-horário
74angle = -math.radians(int(sys.argv[3]))
75
76image = pygame.image.load(file_in)
77w = image.get_width()
78h = image.get_height()
79
80# cria a surface com a proporção a ser alterada
81ws, hs = get_new_image_size(w, h, angle)
82surface = pygame.display.set_mode((ws, hs))
83
84# chama a função fazer o espelhamento
85rotation(image, surface, angle)
86
87# salva a imagem
88pygame.image.save(surface, file_out)
89
90pygame.display.set_caption(file_in)
91
92finish = False
93while not finish:
94 for event in pygame.event.get():
95 if event.type == pygame.QUIT:
96 finish = True
97 elif event.type == pygame.KEYDOWN:
98 if event.key == pygame.K_ESCAPE:
99 finish = True
100 pygame.display.update()
101pygame.quit()
102quit()