tst x y1 1 BAR.baz2 2 FOO." />
Вопрос:

Добавление нескольких столбцов в вызов dplyr mutate

r dplyr

9803 просмотра

1 ответ

77397 Репутация автора

У меня есть фрейм данных с разделенным точкой символом столбца:

> set.seed(310366)
> tst = data.frame(x=1:10,y=paste(sample(c("FOO","BAR","BAZ"),10,TRUE),".",sample(c("foo","bar","baz"),10,TRUE),sep=""))
> tst
    x       y
1   1 BAR.baz
2   2 FOO.foo
3   3 BAZ.baz
4   4 BAZ.foo
5   5 BAZ.bar
6   6 FOO.baz
7   7 BAR.bar
8   8 BAZ.baz

и я хочу разделить этот столбец на два новых столбца, содержащих части по обе стороны от точки. str_split_fixedиз пакета stringrможет сделать работу довольно приятно. Все мои значения, безусловно, две части, разделенные точкой, поэтому я могу сделать:

> require(stringr)
> str_split_fixed(tst$y,"\\.",2)
      [,1]  [,2] 
 [1,] "BAR" "baz"
 [2,] "FOO" "foo"
 [3,] "BAZ" "baz"
 [4,] "BAZ" "foo"
 [5,] "BAZ" "bar"
 [6,] "FOO" "baz"
 [7,] "BAR" "bar"

Теперь я cbindмогу добавить это к своему фрейму данных, но я подумал, что смогу выяснить, как это сделать в dplyrконвейере. Сначала я подумал, mutateможет сделать это в одном:

> tst %.% mutate(parts=str_split_fixed(y,"\\.",2))
Error: wrong result size (20), expected 10 or 1

Я могу mutateсделать это в два:

> tst %.% mutate(part1=str_split_fixed(y,"\\.",2)[,1], part2=str_split_fixed(y,"\\.",2)[,2])
    x       y part1 part2
1   1 BAR.baz   BAR   baz
2   2 FOO.foo   FOO   foo
3   3 BAZ.baz   BAZ   baz
4   4 BAZ.foo   BAZ   foo
5   5 BAZ.bar   BAZ   bar
6   6 FOO.baz   FOO   baz

но это работает строка разделена дважды.

«Лучшее», что я могу сделать до сих пор, dplyrэто то, что я обнаружил, когда писал этот вопрос ...

> tst %.% do(cbind(.,data.frame(parts=str_split_fixed(.$y,"\\.",2))))
    x       y parts.1 parts.2
1   1 BAR.baz     BAR     baz
2   2 FOO.foo     FOO     foo
3   3 BAZ.baz     BAZ     baz
4   4 BAZ.foo     BAZ     foo
5   5 BAZ.bar     BAZ     bar

что неплохо, но теряет много читабельности в канале R. Есть ли простой подход, mutateкоторый я пропустил?

Автор: Spacedman Источник Размещён: 24.07.2014 02:21

Ответы (1)


37 плюса

7201 Репутация автора

Решение

Вы можете использовать separate()из tidyrв сочетании с dplyr:

tst %>% separate(y, c("y1", "y2"), sep = "\\.", remove=FALSE)

    x       y  y1  y2
1   1 BAR.baz BAR baz
2   2 FOO.foo FOO foo
3   3 BAZ.baz BAZ baz
4   4 BAZ.foo BAZ foo
5   5 BAZ.bar BAZ bar
6   6 FOO.baz FOO baz
7   7 BAR.bar BAR bar
8   8 BAZ.baz BAZ baz
9   9 FOO.bar FOO bar
10 10 BAR.foo BAR foo

Установка remove=TRUEудалит столбец у

Автор: beetroot Размещён: 24.07.2014 02:41
Вопросы из категории :
32x32