[Cll/mmol dm -3
IAEA-SM-356/4 EFFECT OF LOW IRRADIATION TEMPERATURES
M. IVANOVA, NIKOLOVA Elgatech Ltd
2.1. GAD dosimeters characteristics
o número de segmentos, seus limites de forma não totalmente aleatória e o rótulo a ser associado a cada segmento; (iii) realizou-se uma avaliação experimental para comparar o novo algoritmo com critério semi-supervisionado com outros não-supervisionados e supervisionados da literatura. A Seção 6.3 propõe uma função de custo projetada para considerar critérios supervisionados e não-supervisionados (i.e. semi-supervisionado).
6.3 Uma função de custo para GRASP-SemTS
Para resolver o problema de segmentação de trajetórias utilizando critério semi- supervisionado, é necessária a definição de uma função de custo que seja capaz de levar em consideração: (i) informação contida nos dados brutos (i.e. critério não-supervisionado); e (ii) informação do domínio (i.e. critério supervisionado). Como mencionado na Seção 5.3, o grau de similaridade dos pontos pode ser medido pela aplicação de funções de distância (Equação 5.1). Para a segmentação com critério semi-supervisionado foi introduzido o conceito de atributo de segmento. Desta forma, é necessário definir uma função de distância que compare dois segmentos em termos de seus atributos de segmento. A Equação 6.1 define uma distância entre atributo de segmentos de dois segmentos s1e s2, onde i representa o iésimo atributo de segmento
dos seus respectivos conjuntos ζB.
distance_segs(ζ1, ζ2) = s B
∑
i=1 (ζ1i− ζ2i)2 6.1A teoria MDL também foi utilizada no projeto da função de custo da segmentação com critério semi-supervisionado. Como o objetivo da função de custo é capturar similaridades entre os pontos e os segmentos provenientes de critérios não-supervisionados e supervisionados, as propriedades de compressão máxima e distorção mínima foram estendidas. Na segmentação com critério semi-supervisionado, a compressão máxima é obtida quando: (i) o número de segmentos é o menor possível; e (ii) cada ponto de referência é o mais semelhante possível aos pontos de referência de classe encontrados no domínio. Já a distorção mínima é adquirida quando a maior homogeneidade possível é conseguida nos segmentos encontrados com relação a seus atributos de ponto e de segmento.
As novas definições das propriedades de compressão máxima e distorção mínima também são conflitantes. Ao se escolher apenas um segmento como solução, a compressão máxima é atingida pois apenas um ponto será escolhido como ponto de referência, sendo este ponto associado a um ponto de referência de classe. Nesta situação, é observado que a taxa de distorção será maximizada por apenas um ponto de referência que será usado para medir a similaridade em termos de atributos de ponto e segmento. Já quando a distorção mínima é atingida o número máximo de segmentos é utilizado, tornando assim os segmentos os mais homogêneos possíveis. Entretanto, a sua taxa de compressão será maximizada, pois seria utilizado o máximo número de segmentos possível.
6.3. Uma função de custo para GRASP-SemTS 117
Para que estas propriedades possam ser utilizadas, deve-se encontrar uma forma de quantificar as taxas de compressão e distorção de uma solução. Para quantificá-las, os seguintes valores devem ser considerados: (i) o número de pontos de referência; (ii) o conjunto dos pontos de referência; (iii) os limites entre os segmentos consecutivos; (iv) as similaridades entre os pontos de referência e os pontos de referência de classe. Ao se alterar qualquer um destes valores, a quantificação da homogeneidade deve ser modificada.
Para o problema de segmentação de trajetórias com critério semi-supervisionado, a hipótese H consiste na escolha de um conjunto de pontos de referência, esta realizada pelo algoritmo de segmentação, em uma trajetória bruta que sejam os mais similares possíveis com os pontos de referência de classe. Encontrar o conjunto ótimo de pontos de referência significa então encontrar a melhor hipótese de acordo com o princípio MDL. Isso pode ser computado ao se: (i) realizar a comparação do conjunto de atributos de ponto dos pontos de referência escolhidos (critério não-supervisionado); e (ii) escolher um ponto de referência o mais semelhante possível em relação a um ponto de referência de classe (critério supervisionado). Quanto mais distantes os pontos de referência consecutivos, melhor é a hipótese H, já que isto representa que o segmento seguinte possui um conjunto de atributos de trajetórias mais dissimilar quando comparado ao segmento anterior. Além disso, quanto mais semelhantes os pontos de referência forem de um ponto de referência de classe, melhor também é a hipótese H. Já para medir o quanto esta hipótese H captura similaridades quando aplicada a uma trajetória bruta τN (i.e. representa
os dados D da teoria MDL), realiza-se a comparação: (i) de cada ponto de referência com o conjunto de pontos inseridos no mesmo segmento que ele, com relação aos atributos de ponto (critério não-supervisionado); e (ii) do conjunto de segmentos encontrado na solução com o ponto de referência de classe ao qual cada segmento foi associado, com relação aos atributos de segmento (critério supervisionado).
A função de custo para segmentação com critério semi-supervisionado é definida na Equação 6.2. Os custos da hipótese H (i.e. L(H)) são formalizados na Equação 6.3a. Já o cálculo do desempenho da hipótese H quando aplicada a um conjunto de dados D (i.e L(D|H)) é mos- trada na Equação 6.4a. Para ambas as equações, τN = (p, p..., pN) denota uma trajetória bruta,
φT = (lm, lm..., lmT) representa um conjunto de pontos de referência, θT = (s, s..., sT) de-
nota um conjunto de segmentos, e λV = (class_lm1, class_lm2...class_lmV) indica um conjunto
de pontos de referência de classe.
As equações pelas quais similaridades são capturadas por meio de critérios não- supervisionados são as mesmas utilizadas pelo algoritmo GRASP-UTS. Para o L(H), foi utilizada a Equação 5.2b, que mede a distância entre os pontos de referência consecutivos do conjunto de θT segmentos. Para o L(D|H), a Equação 5.2c foi utilizada. Como mencionado na Seção
5.3, esta equação mede o grau de similaridade de cada segmento com relação ao ponto de referência escolhido. Foram introduzidas novas componentes em L(H) e L(D|H) com o objetivo de permitir que a função de custo seja capaz de considerar critérios supervisionados. O critério supervisionado da equação proposta utiliza os exemplos dos tipos de segmento a serem encon-
6.3. Uma função de custo para GRASP-SemTS 118
trados no domínio (e.g. conjunto λV). Assim, na Equação 6.3b é computada a menor distância
(arg min) entre os pontos de referência lmje um dos pontos de referência de classe do conjunto
λV em relação aos seus atributos de ponto. O objetivo da Equação 6.3b é encontrar pontos de
referência que se assemelhem ao máximo com os exemplos fornecidos como entrada. Já na Equação 6.4b é calculada a distância em relação aos atributos de segmento do segmento ske o
ponto de referência de classe mais próximo. O valor desta distância é multiplicado pelo número de pontos do segmento sk(|sk|) pois o valor de distância da componente não-supervisionada de
L(D|H) (Equação 5.2c) cresceria numa proporção maior que a sua componente supervisionada. Isso ocorre porque em cada segmento, existe apenas um conjunto de atributos de segmento associado. Como a componente não-supervisionada de L(D|H) cresce a medida que o número de pontos do segmento é aumentado, esta multiplicação é realizada para que o valor da componente supervisionada cresça na mesma proporção. O objetivo desta equação é aproximar, com relação aos atributos de ponto e segmento, os segmentos encontrados no conjunto θT de um ponto de
referência de classe proveniente do domínio da aplicação.
semi− supervised_cost(φT, θT, λV) =
semi− supervised_L(H)(φT, λV) + semi − supervised_L(D|H)(θT, λV)
6.2
semi− supervised_L(H)(φT, λV) = unsupervised_L(H)(φT) + supervised_L(H)(φT, λV)
6.3a supervised_L(H)(φT, λV) = T
∑
j=1log2(1. + arg min
i∈[1,V ](distance(lmj, class_lmi)))
6.3b
semi− supervised_L(D|H)(θT, λV) = unsupervised_L(D|H)(θT) + supervised_L(D|H)(θT, λV)
6.4a supervised_L(D|H)(θT, λV) = T
∑
k=1log2(1. + arg min
i∈[1,V ](distance_segs(class_lmi, sk) ∗ (|sk| − 1))) 6.4b
O cálculo da função de custo semi-supervisionada proposta é exemplificado na Equação 6.5. Este exemplo usa como base a Figura 6.1, onde os segmentos são associados a rótulos de alta e baixa velocidade. Na Equação 6.5, os pontos p3, p7e p10 foram escolhidos como pontos